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Capitulo 1 


Conceitos Basicos e Tecnicas de 
Estatfstica Descritiva 

1.1 Introducao 

A estatfstica torna-se a cada dia uma importante ferramenta de apoio a decisao. 
0 objetivo deste capitulo e apresentar importantes conceitos de estatfstica e trabalhar 
a intuigao do aluno para que este raciocine em cirna de problemas que sao tipicamente 
solucionados com o uso de tecnicas estatfsticas. 

Para iniciar toda a discussao, primeiramente e necessario conhecer melhor o conceito 
de estatfstica. As pessoas comumente escutam falar sobre estatfstica na rnfdia. Diaria- 
rnente sao divulgadas informagoes tais como: indices de inflagao, taxa de mortalidade, 
fndice de desenvolvimento humano, proporgao de eleitores, dentre outras. 

O primeiro cuidado que devemos tomar e distinguir as estatfsticas (valores numericos 
que resumem informagdes) da Estatfstica que ganhou status de ciencia. Nesta introdugao, 
esta distingao sera feita da seguinte forma, a Estatfstica como ciencia tera sempre a 
primeira letra maiuscula , enquanto a estatfstica que transmite uma informagao numerica 
sera mencionada com a primeira letra minuscula. 

No dicionario Aurelio, podemos encontrar como a primeira definigao para Estatfstica: 

[Do fr. statistique.] S. f. 1. Parte da matematica em que se investigam os processos 
de obtengao, organizagao e analise de dados sobre uma populagao ou sobre uma colegao 
de seres quaisquer, e os metodos de tirar conclusoes e fazer ilagdes ou predigoes com base 
nesses dados. 

Nesta definigao, a Estatfstica e definida como parte da matematica. Entretanto, a 
Estatfstica ja se desenvolveu o bastante para ocupar um campo no cenario cientffico como 
ciencia que possui metodos e tecnicas proprias. O farnoso matematico John Tukey, que 
muito contribuiu para a Estatfstica, a caracterizou como: 

”E uma ciencia e nao apenas um ramo da matematica, embora ferramentas da 

matematica sejam essenciais”. 
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Em um rapido levantamento e possivel encontrar varias definigbes para Estatistica, 
das quais citaremos algumas interessantes. 

’’Ciencia que utiliza metodos rigidos para lidar com incertezas”. 

’’Ciencia que procura estabelecer os limites da incerteza”. 

’’Ciencia que coleta, classifica e avalia numericamente fatos que servirao de 
base para inferencia”. 

’’Ciencia da Incerteza”. 

Outras definigoes de conteudo metaforico sao: 

”...e a arte de torturar os dados ate que eles confessem a verdade”. 

”...nada mais e do que o bom senso expresso em numeros”. 

Embora todas as definigoes apresentadas contenham elementos importantes, a Es- 
tatistica a ser apresentada neste material estara mais relacionada a defmigao a seguir: 

A Estatistica e um conjunto de metodos e tecnicas que auxiliam a tomada 
de decisao sob a presenga de incerteza.” 1 

Na maioria das definigoes apresentadas, verificamos a presenga da palavra incerteza. 
De fato, o conceito de incerteza esta vinculado a aplicagao dos metodos e tecnicas de 
analise estatistica. 

A incerteza 

A incerteza perinea varias areas do conhecimento: fisica, ciencias sociais, compor- 
tamento hurnano, economia e ciencias naturais. O tratamento quantitative adequado a 
incerteza e obtido por rneio do estudo de probabilidades. 

A incerteza e conseqiiencia da variabilidade de um fenomeno e dificulta a tomada 
de decisoes. Considere um simples exemplo da vida cotidiana: a ida de uma pessoa a 
uma agenda bancaria. Em torno deste fenomeno ha uma serie de incertezas, por exemplo: 
a quantidade de pessoas na fila, o nurnero de atendentes, o tempo de atendimento, as 
condigoes do tempo, a cotagao da moeda,etc. 

Mesmo que um individuo procure informagoes previas sobre todos estes elementos, 
sob os quais paira a incerteza, ainda assim nao sera possivel predizer o desfecho. Podemos, 
por exemplo, analisar as condigoes do tempo, obter informagoes sobre o trafego, ligar para 
a agenda bancaria e, ainda assim, nao conseguimos precisar o horario em que receberemos 
o desejado atendimento bancario. 


1.1. Introdugao 
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1.1.1 Estatistica descritiva x estatistica inferencial 

A Estatistica e conhecida, por muitas pessoas, como uma ferramenta meramente 
descritiva, ou seja, descreve dados por meio de percentagens, graficos e tabelas. Apesar da 
estatistica cumprir, tambem, este papel de resumir as informagoes, seu potencial de uso e 
nruito mais amplo. 

A tomada de decisao se apoia no uso da Estatistica Inferencial. A seguir sao deline- 
adas as fungoes destas duas abordagens: 

Estatistica descritiva (Dedutiva) 

O objetivo da Estatistica Descritiva e resumir as principals caracteristicas de urn 
conjunto de dados por meio de tabelas, graficos e resumos numericos. Descrever os dados 
pode ser comparado ao ato de tirar uma fotografia da realidade. Caso a camera fotogra- 
fica nao seja adequada ou esteja sem foco, o resultado pode sair distorcido. Portanto, a 
analise estatistica deve ser extremanrente cuidadosa ao escolher a forma adequada de re- 
sumir os dados. Apresentamos na Tabela 1.1 um resumo dos procedimentos da Estatistica 
Descritiva. 


Tabela 1.1: Resumo de tecnicas de estatistica descritiva 


Tabelas de freqiiencia 

Ao dispor de uma lista volumosa de dados, as 
tabelas de freqiiencia servem para agrupar infor- 
magoes de rnodo que estas possarn ser analisa- 
das. As tabelas podem ser de freqiiencia simples 
ou de freqiiencia em faixa de valor es. 

Graficos 

0 objetivo da representagao grafica e dirigir a 
atengao do analista para alguns aspectos de um 
conjunto de dados. 


”Um grafico vale mais que mil pala- 
vras”. 


Alguns exemplos de graficos sao: diagrama de 
barras, diagrama em setores, histograma, box- 
plot, ramo-e-folhas, diagrama de dispersao, gra- 
fico sequencial. 

Resumos numericos 

Por meio de medidas ou resumos numericos po- 
dernos levantar importantes informagoes sobre o 
conjunto de dados tais como: a tendencia cen- 
tral, variabilidade, simetria, valores extremos, 
valores discrepantes, etc. 
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Estatistica inferencial (Indutiva) 

A Estatistica Inferencial utiliza informagbes incompletas para tomar decisoes e tirar 
conclusoes satisfatorias. O alicerce das tecnicas de estatistica inferencial esta no calculo 
de probabilidades. Duas tecnicas de estatistica inferencial sao as rnais conhecidas: a 
estimagao e o teste de hipoteses que sao descritas na Tabela 1.2. 


Tabela 1.2: Resumo de tecnicas de estatistica inferencial 


Estimagao 

A tecnica de estimagao consiste em utilizar um 
conjunto de dados incompletos, ao qual iremos 
chamar de amostra, e nele calcular estimativas 
de quantidades de interesse. Estas estimativas 
podern ser pontuais (representadas por um unico 
valor) ou intervalares. 

Teste de Hipoteses 

O fundamento do teste estatistico de hipoteses 
e levantar suposigoes acerca de uma quantidade 
nao conhecida e utilizar, tambem, dados incom- 
pletos para criar uma regra de escolha. 


Um exemplo tradicional do uso da estatistica inferencial e apresentado a seguir. 

Exemplo 1.1. Um instituto de pesquisa deseja estimar a proporgao de eleitores do partido 
de situagao no primeiro turno das eleigoes presidenciais. Ao coletar uma amostra de 1200 
eleitores, a proporgao foi estimada em 54%. 

No Exemplo 1.1, a quantidade a ser estimada e a proporgao de eleitores que votarao 
no partido de situagao nas eleigdes presidenciais. Somente a realizagao das eleigoes revelara 
esta quantidade. Entretanto, estima-la, com base em uma amostra, auxilia a tomada de 
decisoes tais como a alteragao de uma estrategia de campanha politica. 

Uma outra aplicagao da estatistica inferencial aparece no Exemplo 1.2 em que duas 
hipoteses sao colocadas em questao. Sera que uma nova droga a ser langada aumenta, ou 
nao, a produgao de um hormonio ? 

Exemplo 1.2. Um laboratorio deseja verificar se uma nova droga aumenta a produgao de 
testosterona em hornens com idade acirna de 35 anos. Ao aplica-la em um grupo de 40 in- 
dividuos, constatou-se que apos um periodo de tempo a droga aumentou significativamente 
a quantidade do referido hormonio. 

Exemplo 1.3. Em uma fabrica de parafusos, a pega e considerada dentro da especificagao 
caso seu comprimento esteja no intervalo entre 4,8cm e 5,2cm. Os tecnicos de controle 
de qualidade selecionam diariamente 100 parafusos fabricados e calculam o comprimento 
medio. Conhecendo a variabilidade nos tamanhos dos parafusos fabricados, caso o compri- 
mento medio esteja abaixo de 4,99 cm ou acima de 5,01 cm, o processo sera interrompido. 
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No Exemplo 1.3, espera-se que o comprimento medio de um conjunto de parafusos 
amostrados esteja dentro de um intervalo. Caso isto nao ocorra, o processo de produgao 
sofre uma interrupgao. Neste caso, a estatistica inferencial e utilizada para criar uma regra 
de decisao com base em observagoes de um subconjunto de 100 pegas. 

1.1.2 Populagao e amostra 

O uso da Estatistica Inferencial oferece suporte a tomada de decisao com base em 
apenas uma parte das informagoes relevantes no problema estudado. A partir de agora, 
vamos utilizar os conceitos de populagao e amostra para representar, respectivamente, o 
conjunto total e o conjunto parcial destas informagoes. 

Populagao: e o conjunto de todas as unidades sobre as quais ha o interesse de 
investigar uma ou rnais caracterfsticas. O conceito de populagao em Estatistica e bem mais 
amplo do que o uso comum desta palavra. A populagao pode ser formada por pessoas, 
domicilios, pegas de produgao, cobaias, ou qualquer outro elemento a ser investigado. 

Amostra: e um subconjunto das unidades que constituem a populagao. 

A caracterizagao da populagao e feita em fungao de um problema a ser estudado. 
Se um vendedor deseja fazer um levantamento dos potenciais clientes para o seu produto, 
a populagao sera formada por todos os individuos com possibilidade de consumir aquele 
produto. Se este produto for, por exemplo, um iate, a populagao deve ser constituida 
apenas por individuos com renda suficiente para compra-lo. Se o objetivo for avaliar a 
eficacia de tratamento contra um tipo de cancer, somente individuos com este problema 
devem cornpor a populagao. 

Para que haja uma clara definigao das unidades que formarn a populagao e necessaria 
a especificagao de 3 elementos: uma caracteristica em comum, localizagao temporal e 
localizagao geografica. 

Exemplo 1.4. Estudo da inadimplencia de clientes em um banco multinacional com 
agencias no Brasil. 


Problema: Estudar a inadimplencia dos clientes do banco HSBC. 


Caracteristica 

correntista do banco HSBC 

Tempo 

clientes com cadastro em julho de 
2007 

Regiao 

agencias de Curitiba e regiao metro- 
politana 


Exemplo 1.5. Estudo da obesidade em alunos do segundo grau por intermedio da medida 
do indice de rnassa corporea. 

Sem a definigao dos 3 elementos, conforme os exemplos acima, torna-se dificil pro- 
ceder a coleta de dados. Quando um estudo estatistico levanta informagoes de todas as 


6 Conceitos Basicos e Tecnicas de Estatistica Descritiva 


Correa da Rosa, J. M. 


Problema: Estudar a obesidade em alunos do segundo grau. 


Caracterlstica 

alunos de 2o. grau da rede publica 

Tempo 

matriculados em janeiro de 2007 

Regiao 

regiao metropolitana de Curitiba 


unidades da populagao, este chama-se Censo. Ha casos em que o levantamento censitario 
e inviavel, como por exemplo em testes destrutivos. Mesmo quando e possivel realizar o 
Censo, o custo representa quase sempre um entrave. Nestes casos, a salda e estudar apenas 
parte da populagao para inferir sobre o todo e o levantamento e dito ser por amostragem. 

O processo de amostragem pode ser probabillstico (aleatorio) ou nao-probabillstico 
(nao-aleatorio) . Os metodos de inferencia estatistica sao aplicaveis no primeiro caso pois 
a amostragem probabillstica garante a representatividade da amostra. Como nem sempre 
as unidades da amostra podem ser obtidas por meio de selegao probabillstica, existem 
alternativas como a amostragem de conveniencia e amostragem por quotas. 

Quando a amostragem e probabillstica e necessaria a existencia de um cadastro que 
contenha a relagao de todas as unidades na populagao. 

Tecnicas de amostragem 

A Teoria de Amostragem e um ramo da estatistica que estuda metodos para levan- 
tar amostras que sejam representativas da populagao. O princlpio basico desta teoria e 
ter o maximo de precisao na avaliagao das quantidades de interesse com o mlnimo tama- 
nho de amostra. Nem sempre e possivel ponder ar estas duas questoes de forma a obter 
amostras representativas. Sendo assirn, diferentes metodos de selegao de amostras foram 
desenvolvidos para situagoes especlficas. Apresentamos e discutimos alguns deles. 

• Amostragem Aleatoria Simples: Consiste em selecionar aleatoriamente uma amostra 
de tamanho n em uma populagao formada por N indivlduos. A grande vantagem 
desta tecnica e atribuir igual probabilidade de selegao a todas as posslveis amostras. 
Entretanto, para este tipo de amostragem, e crucial a existencia de um cadastro com 
a relagao de todas as unidades populacionais. Isto e inviavel em muitas situagoes. 
Esta amostragem pode ser feita com reposigao, o que garante a probabilidade 1/N 
de um elemento da populagao participar da amostra. Por outro lado, nessa situagao 
um elemento pode aparecer multiplas vezes. Quando a amostragem e feita sem repo- 
sigao, a probabilidade de um elemento ser incluldo na amostra se modifica durante 
o processo de selegao, pois a populagao e seqiiencialmente reduzida de 1 elemento. 

• Amostragem Aleatoria Estratificada: Este tipo de amostragem busca a formagao 
de h estratos homogeneos em relagao a caracterlstica estudada e, posteriormente, 
amostragem aleatoria simples ou amostragem sistematica dentro de cada estrato. A 
amostragem estratificada e vantajosa quando ha o conhecimento previo de grupos 
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que sejam mais homogeneos internamente e heterogeneos entre si, em relagao a ca- 
racteristica investigada. Nestas situagdes ha um ganho em relagao a amostragem 
aleatoria simples pois a selegao dentro dos estratos leva a diminuigao do tamanho de 
amostra, mantendo a precisao das estimativas. Uma etapa importante da amostra- 
gem aleatoria estratificada e a alocagao da amostra pelos estratos, ou seja, quantos 
elementos da amostra pertencerao ao estrato 1, estrato 2,. . estrato h. Dois tipos 
de alocagao sao comumente aplicados: alocagao uniforme (mesmo numero de ele- 
mentos nos estratos) e a alocagao proporcional (numero de elementos proporcional 
ao tamanho do estrato). 

• Amostragem por Conglomerados (Clusters): Neste metodo, ao inves da selegao de 
unidades da populagao, sao selecionados conglomerados (clusters) destas unidades. 
Esta e uma alternativa para quando nao existe o cadastro. Se a unidade de interesse, 
por exemplo, for um aluno, pode ser que nao exista um cadastro de alunos, mas sim 
de escolas. Portanto, pode-se selecionar escolas e nelas investigar todos os alunos. 
Este tipo de amostragem induz indiretamente aleatoriedade na selegao das unidades 
que formarao a amostra e tern a grande vantagem de facilitar a coleta de dados. 

• Amostragem Sistematica: Caso exista uma lista das unidades populacionais, a amos- 
tragem sistematica e uma tecnica simples que a partir da razao k = ^ , de unidades 
populacionais para cada unidade amostral, sorteia-se um numero inteiro no inter- 
valo [1, /c] que serve como ponto de partida para a escolha do primeiro elemento a 
ser incluido na amostra. Descartando os k — 1 proximos elementos, seleciona-se o 
segundo e assim por diante. Tal como na amostragem aleatoria simples, e necessaria 
a existencia de um cadastro, entretanto nem todas amostras sao passfveis de selegao, 
por isto este procedimento e classihcado como quasi-aleatorio. Uma das grandes van- 
tagens da amostragem sistematica, em relagao a amostragem aleatoria simples, e a 
praticidade na selegao dos elementos. Problemas com a amostragem sistematica po- 
dem surgir quando a seqiiencia dos elementos no cadastro induz um comportamento 
periodico ou cfclico na principal variavel a ser investigada. Considere, por exemplo, 
uma vila com 20 casas numeradas de 1 a 20. Se todas as casas cujos numeros sao 
multiplos de 4 estiverem mais perto da linha de trem e o intuito e rnedir poluigao 
sonora, a amostragem sistematica nao sera adequada. 

• Amostragem por Cotas: A amostragem por cotas assemelha-se e amostragem estra- 
tificada, embora dentro dos estratos nao seja feita a amostragem aleatoria simples, 
e uma alternativa para casos em que nao ha a existencia de um cadastro, mas ha 
informagao disponivel sobre o perfil desta populagao em relagao a um fator de estra- 
tificagao que pode auxiliar a representatividade da amostra (exemplo:50% de hornens 
e 50% de mulheres). 

• Amostragem de Conveniencia: Esta e uma forma de amostragem nao-probabilistica 
que leva em conta as restrigoes envolvidas no levantamento amostral. A unidades 


8 Conceitos Basicos e Tecnicas de Estatistica Descritiva 


Correa da Rosa, J. M. 


amostrais sao inclufdas por algum tipo de conveniencia, em geral ausencia de tempo 
e recursos materials para o levantamento dos dados. Embora nao sejarn feitas in- 
ferencias em amostras de conveniencia, estas podem ser importantes para levantar 
hipoteses e formular modelos. 


Exemplo 1.6. Uma firma de contabilidade tern N = 50 clientes comerciantes. Seu pro- 
prietary pretende entrevistar uma amostra de 10 clientes para levantar possibilidades de 
melhora no atendimento. Escolha uma amostra aleatoria simples de tamanho n = 10. 

• Primeiro passo: atribuir a cada cliente um numero entre 1 e 50. 

• Segundo passo: recorrer a tabela de numeros aleatorios para selecionar aleatoria- 
rnente 10 numeros de 1 a 50. Os clientes identificados pelos numeros selecionados 
comporao a amostra. 


Exemplo 1.7. Uma escola tern um arquivo com 5000 fichas de alunos e sera selecionada, 
sistematicamente, uma amostra de 1000 alunos. Neste caso, a fragao de amostragem e 

Tl 

igual a — = 1000/5000 que representa k = 5 elementos na populagao para cada elemento 
selecionado na amostra. Na amostragem sistematica somente o ponto de partida e sorteado 
dentre as 5 primeiras fichas do arquivo. Admitamos que foi sorteado o numero 2, entao a 
amostra e formada pelas fichas 2, 7, 12, 17, ... , 4992, 4997. 


1.1.3 Variaveis e suas classificagoes 

Em um levantamento de dados, censitario ou por amostragem, investiga-se uma ou 
mais caracterfsticas de interesse que supostamente variam de uma unidade para outra. 
Estas caracterfsticas serao chamadas a partir de agora de variaveis. A variavel pode ser 
uma quantidade, sobre a qual podem ser realizadas operagdes aritmeticas, ou pode ser um 
atributo como cor de pele, zona de moradia ou classe social. No primeiro caso, a variavel 
e classihcada como quantitativa e na outra situagao ela e dita ser qualitativa. 

A classificagao da variavel vai ser determinante para o tipo de analise estatistica 
a ser conduzida. Sobre uma variavel qualitativa, nao podemos calcular muitos dos resu- 
mos numericos tais como a media aritmetica, a variancia e o desvio padrao. Por outro 
lado, o grafico de setores (ou pizza), nao e adequado para representar as freqiiencias das 
temperaturas observadas durante um ano, ao rnenos que os valores sejam categorizados. 

As variaveis quantitativas possuem uma subclassificagao, elas podem ser discretas 
ou contfnuas. O primeiro caso ocorre quando os possfveis valores da variavel podem ser 
enumerados. Esta situagao e tfpica de dados oriundos de contagens, como por exemplo 
o numero diario de assaltos em um quarteirao que pode assumir valores no conjunto 
{0, 1, 2, 3, . . .}. A segunda subclassificagao ocorre nos casos em que a variavel pode assumir 
valores em um intervalo contfnuo, por conseqiiencia, os possfveis valores sao infinitos e nao- 
enumeraveis. A variavel idade, por exemplo, e uma variavel contfnua pois se for medida 
com bastante precisao, um indivfduo pode apresentar 32,1023 anos de idade e, dificilmente 
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dois indivfduos terao idades iguais. A seguir sao apresentados alguns outros exemplos de 
variaveis quantitativas: 

• Variaveis quantitativas 

Discretas: numero de filhos, numero de plantas, quantidade de pegas e numero 
de assaltos. 

Continuas: as variaveis contfnuas podem assumir infinitos valores (fndice de 
pregos, salario, peso, altura e pressao sistolica). 

Toda variavel que nao e quantitativa, sera classificada como qualitativa. Os valores 
que a variavel pode assumir sao chamados de nfveis ou categorias. Caso estes nfveis sejam 
ordenaveis, a variavel e dita ser ordinal, caso contrario ela e classificada como nominal. E 
importante ressaltar que esta ordenagao nos nfveis (categorias) da variavel e natural tal 
como ocorre com a variavel classe social. Nesta situagao, Classe A > Classe B > Classe C 
> Classe D. Como ja foi comentado, o tipo de variavel determina o tipo de analise e, para 
variaveis qualitativas ordinais, um resumo numerico, uma tecnica grafica ou uma tabela 
de freqiiencia deve incorporar a ideia de ordenagao. 

• Variaveis qualitativas (atributos) 

Ordinais (ex: classe social, cargo na empresa e classificagao de um filme.) 

Nominais (ex: sexo, bairro, cor de pele e canal de TV preferido.) 

alem das classificagoes mencionadas, vamos destacar uma outra situagao ern que a 
caracterfstica de interesse e investigada ao longo do tempo (espago) constituindo o que 
chamamos de uma serie temporal. A analise de uma variavel que e rnedida ao longo do 
tempo deve considerar aspectos especfficos como tendencia e sazonalidade. Ao resumir 
estas variaveis, quando ha a presenga de tendencia o valor medio modifica-se ao longo do 
tempo, enquanto a sazonalidade pode explicar variagdes periodicas, como o aumento de 
venda de televisores nos meses de novembro e dezembro. 

Serie temporal 

Conjunto de observagoes ordenadas no tempo (fndice mensal de inflagao, tempera- 
tura maxima diaria, cotagao diaria do dolar e numero de nascimentos diarios.). 

1.2 Tecnicas de estatistica descritiva 

A principal fungao da Estatistica Descritiva e resumir as informagoes contidas em um 
conjunto de dados por meio de tabelas, graficos e medidas caracterfsticas (resumos nurne- 
ricos). A descrigao dos dados deve ser objetiva, ter precisao de significado e simplicidade 
no calculo para que outras pessoas possarn compreender e, eventualmente, reproduzir os 
resultados. Recorremos novamente aqui a metafora da fotografia pois realizar uma analise 
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descritiva e como tirar uma foto da realidade, caso a lente esteja desfocada, o resultado 
nao sera claro. 

As tecnicas de estatistica descritiva sao aplicadas a observagdes de uma ou mais 
variaveis, tomadas nas unidades de interesse. Quando apenas uma variavel e resumida, a 
descrigao e univariada, caso duas variaveis sejam resumidas conjuntamente, a descrigao e 
bivariada. Ao conjunto de observagoes de uma variavel chamaremos de dados brutos, lista 
ou rol. 

1.2.1 Tabelas de freqiiencias 

A partir dos dados brutos, podemos agrupar os valores de uma variavel quantitativa 
ou qualitativa e construir a chamada tabela de freqiiencias. As tabelas de freqiiencias 
podern ser simples ou por faixas de valores, dependendo da classificagao da variavel. 

Tabelas de freqiiencias simples 

As tabelas de freqiiencias simples sao adequadas para resumir observagdes de uma 
variavel qualitativa ou quantitativa discreta, desde que esta apresente urn conjunto pe- 
queno de diferentes valores. 

Utilizamos os dados presentes em Magalhaes &; Lima (2004), referentes a um questi- 
onario aplicado a moradores de comunidades de baixa renda em Sao paulo, para construir 
a Tabela 1.3 que resume as observagdes da variavel estado civil. 


Tabela 1.3: Freqiiencias de estado civil em uma anrostra de 385 individuos. 


Estado Civil 

Freqiiencia Absoluta 

Freqiiencia Relativa Percentual 

Solteiro 

165 

42,86% 

Casado 

166 

43,12% 

Divorciado 

10 

2,6% 

Viuvo 

12 

3,12% 

Outro 

32 

8,31% 

Total 

385 

100% 


A variavel estado civil e qualitativa nominal e no levantamento feito nos 385 indivf- 
duos apareceram respostas que foram agrupadas em 5 niveis (categorias) para esta variavel: 
Solteiro, Casado, Divorciado, Viuvo e Outro. A construgao da tabela de freqiiencia sim- 
ples, neste caso, resume os dados brutos pela contagem de vezes (freqiiencia absoluta) que 
uma determinada categoria foi observada. 

A partir da Tabela 1.3, podemos rapidamente tirar conclusdes a respeito dos dados 
como a constatagao de que neste grupo de individuos, a quantidade de solteiros(165) e 
casados(166) e praticamente a nresma e ha uma parcela muito pequena de divorciados(lO). 
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Estes comentarios, embora simples, tornam-se mais claros quando analisamos a coluna das 
freqiiencias relativas. 

• rif freqiiencia do valor i 

• n: freqiiencia total 

• /,; = — : freqiiencia relativa (util quando comparamos grupos de tamanhos diferentes) 

• fi x 100: freqiiencia relativa percentual 

Para variaveis cujos valores possuem ordenagao natural faz sentido incluirmos tam- 
bem uma coluna contendo freqiiencias acumuladas fac. Sua construgao ajuda a estabelecer 
pontos de corte, chamados de separatrizes ou quantis, a partir dos quais esta concentrada 
uma determinada freqiiencia de valores da variavel. 

A Tabela 1.4 exibe as freqiiencias das idades em uma amostra de 50 estudantes que 
preencheram um questionario sobre habitos de lazer (ver Magalhaes &: Lima(2004)). 

Tabela 1.4: Tabela de freqiiencias para a variavel Idade. 


Idade 

rii 

fi 

fac 

17 

9 

0,18 

0,18 

18 

22 

0,44 

0,62 

19 

7 

0,14 

0,76 

20 

4 

0,08 

0,84 

21 

3 

0,06 

0,90 

22 

0 

0 

0,90 

23 

2 

0,04 

0,94 

24 

1 

0,02 

0,96 

25 

2 

0,04 

1,00 

total 

n=50 

1 



Tabelas de freqiiencias em faixas de valores 

Para agrupar dados de uma variavel quantitativa continua ou ate mesmo uma va- 
riavel quantitativa discreta com muitos valores diferentes, a tabela de freqiiencias simples 
nao e mais um metodo de resumo, pois corremos o risco de praticamente reproduzir os 
dados brutos. 

A utilizagao de tabelas, nestas situagoes em que a variavel registra diversos valores, 
e feita mediante a criagao de faixas de valores ou intervalos de classe. Utilizando este 
procedimento, devemos tomar cuidado pois ao contrario da tabela de freqiiencia simples, 
nao e mais possivel reproduzir a lista de dados a partir da organizagao tabular. Em outras 
palavras, estamos perdendo informagao ao condensa-las. 
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Veja o exemplo na Tabela 1.5 que traz dados sobre as horas semanais de atividades 
fisicas dos 50 estudantes que participaram do levantamento sobre habitos de lazer. 

Tabela 1.5: Tabela de freqiiencias para a variavel horas semanais de atividade ffsica 


horas semanais de atividade fisica rii 

fi 

fac 

0 |- 2 

11 

0,22 

0,22 

2 |- 4 

14 

0,28 

0,5 

4-6 

12 

0,24 

0,74 

6 |— 8 

8 

0,16 

0,90 

8 |- 10 

3 

0,06 

0,96 

10 |- 12 

2 

0,04 

1,00 

total 

50 

1 



O resumo na Tabela 1.5 e feito mediante a construgao de 6 intervalos de comprimento 
igual a 2 horas e posteriormente a contagem de indivfduos com valores identificados ao 
intervalo. Um individuo que gastou 6 horas semanais de exercfcio sera contado no quarto 
intervalo (6|-8) que inclui o valor 6 e exclui o valor 8. 

No rnesmo levantamento amostral foi observado o peso dos 50 estudantes. A variavel 
peso e classificada corno quantitativa continua e foi mensurada com uma casa decimal. 
Com esta precisao de rnedida foram observados 36 valores diferentes, o que inviabiliza a 
construgao da tabela de freqiiencia simples. 

Novamente o recurso a ser utilizado e construir classes ou faixas de pesos e contar o 
numero de ocorrencias em cada faixa. Com 6 intervalos de peso, os dados foram agrupados 
conforme a Tabela 1.6. 

Tabela 1.6: Tabela de freqiiencias para a variavel Peso 


Peso de criangas rij 

fi 

fac 

40,0 j 

- 50,0 

8 

0,16 

0,16 

50,0 | 

- 60,0 

22 

0,44 

0,60 

60,0 | 

-70,0 

8 

0,16 

0,76 

70,0 | 

- 80,0 

6 

0,12 

0,88 

80,0 | 

-90,0 

5 

0,10 

0,98 

90,0 | 

-100,0 

1 

0,02 

1,00 

total 


100 

1 



Se concordamos que a tabela em faixa de valores ajuda a resumir a quantidade de 
informagoes em um conjunto de dados, com variaveis continuas ou discretas que assumam 
muitos valores, ainda fica pendente a questao de quantos intervalos serao necessarios para 
a construgao desta tabela. 
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Para a decepgao de muitos, nao ha uma resposta definitiva a esta pergunta e existem 
varias sugestoes na literatura para se chegar a este nurnero. Esta questao sera discutida 
posteriormente ao falarmos de uma tecnica grafica chamada de histograma, mas o bom 
senso indica que o nurnero de intervalos deve estar entre 5 e 10 neste tipo de descrigao. 

1.2.2 Medidas-resumo 

Em um processo de coleta de dados, por meio de amostragem ou censo, faz-se neces- 
sario resumir as informagoes contidas nas observagoes das variaveis utilizando as medidas 
adequadas. Neste capftulo, estas serao chamadas medidas-resumo. Veja o exemplo a 
seguir. 

Exemplo 1.8. Em um ponto de onibus, uma pessoa pergunta sobre o tempo ate a passa- 
gem de uma determinada linha. Suponha que voce havia registrado, na sernana anterior, 
os tempos (em minutos) e obteve os seguintes resultados: 

9; 12; 8; 10; 14; 7; 10 

Ao responder: ”o onibus demora, em media, 10 minutos”, voce esta trocando um 
conjunto de valores por um unico nurnero que os resume. Ao adotar este procedimento foi 
utilizada uma medida-resumo, neste caso a media aritmetica. 

Novamente, a classificagao da variavel vai oriental’ a escolha da rnedida resumo rnais 
adequada. A rnaior parte das medidas a serem apresentadas aplicam-se somente a variaveis 
quantitativas. 

As medidas-resumo podem focar varios aspectos no conjunto de dados; tendencia 
central, dispersao, ordenagao ou simetria na distribuigao dos valores. Aqui serao apresen- 
tadas 3 classes de medidas: 

• Tendencia Central 

• Dispersao (Variabilidade) 

• Separatrizes 1 

Tendencia central 

As medidas de tendencia central indicam, em geral, um valor central em torno do 
qual os dados estao distribuidos. Este valor no Exemplo 1.8 e igual a 10 e corresponde a 
media aritmetica. As principals medidas de tendencia central na Estatfstica sao: media, 
mediana e moda. Alem destas, outras medidas sao utilizadas com fins especificos tais 
como: media geometrica, media harmonica, media ponderada e trimedia. 

Sejam as observagoes obtidas a partir da variavel X, em uma populagao ou em uma 
amostra: 


1 Alguns autores classificam as medidas de tendencia central e separatrizes como medidas de posigao. 
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Xl j *^2 j ■ ■ ■ i X n 

e considere a seguinte notagao para os dados ordenados: 


•E(l) i •E(2) i ' • • i -E(n) 

em que x^ e o menor valor (mrnirno) no conjunto de dados e X( n ) e o maior valor (maximo). 
Com base nesta notagao, apresentamos a seguir os conceitos de media, mediana e 

moda. 


Media (Aritmetica) 

A media aritmetica tambem e conhecida como ponto de equilfbrio e centro de gra- 
vidade, denominagoes surgidas da Ffsica. Ela indica o valor em torno do qual ha um 
equilfbrio na distribuigao dos dados. O seu calculo e feito conforme: 


%obs — 




n 


Definindo desvio da i-esima observagao, em torno da media observada, como di = 
Xi — x 0 bs j a soma destes desvios sempre sera igual a zero. A demonstragao deste resultado 
e trivial. Basta observar que: 


n n n n 

yipzi - x obs ) =y^xj- nx obs = Xi - xj = o. 

2—1 2=1 2=1 2=1 

A media aritmetica e pouco robusta as mudangas em valores extremos no conjunto 
de dados observados. 

Suponha um conjunto de valores ordenados de forma crescente, £(i ),X( 2 ),. • -,X( n ) e 
neles a media aritmetica permanece x 0 b s ■ Se um erro de anotagao acrescentasse k unidades 
ao maior valor da amostra (®( n )), a media inicialmente calculada x 0 b s sera acrescida de k/n 
unidades. O impacto da alteragao na media sera diretamente proporcional a magnitude 
de k e inversamente proporcional a quantidade de observagoes n. 

A media so podera ser calculada para variaveis quantitativas (discretas e contfnuas). 
A unica excegao ocorre quando a variavel qualitativa e binaria, ou seja, apresenta duas 
categorias como por exemplo: masculino e feminino. Se atribuirmos os valores 0 e 1 
as categorias masculino e feminino, respectivamente, ao realizar o calculo da media o 
resultado indica a proporgao de mulheres na amostra. 

Exemplo 1.9. Uma pesquisa registrou em um grupo de 10 pessoas a satisfagao em relagao 
ao governo. Cada respondente deveria simplesmente informar se estava satisfeito ou nao. 
Para os que estavam satisfeitos, anotou-se o valor 1 e os que estavam insatisfeitos 0. No 
final foi obtido o seguinte conjunto de dados: 
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x\ = l;x 2 = l;x 3 = 0;x4 = 0 ;x 5 = 0;x6 = 0 ;x 7 = 0; ccs = l;xg = 0;xio = 1. 
A media calculada a partir dos dados acima e igual a : 


%obs — 


E n 

i= 1 X 


n 


1 = — = 0,4. 
10 


A interpretagao deste resultado e de que 40% dos entrevistados estao satisfeitos com 
o governo. 


Com isto, verificamos que ao calcular a proporgao estamos calculando a media de 
uma variavel qualitativa binaria. 


Mediana 

A mediana observada md obs e o valor central em um conjunto de dados ordenados. 
Pela mediana o conjunto de dados e dividido em duas partes iguais sendo metade dos 
valores abaixo da mediana e, a outra metade, acima. 

Vamos denominar md ob s o valor da mediana observado em um conjunto de dados. 
Repare que para encontrar um numero que divida os n dados ordenados em duas partes 
iguais devern ser adotados dois procedimentos: 


se n e impar 


TYldobs — X( n+ 1 ^ . 


se n e par 


Wldobs 


X(|) +X(n +1 ) 

2 


1. Para um conjunto com um numero n (impar) de observagbes, a mediana e o valor 
na posigao . 


2. Para um conjunto com um numero n (par) de observagbes a mediana e a media 
aritmetica dos valores nas posigoes | e | + 1. 

Exemplo 1.10. Um levantamento amostral coletou e ordenou de forma crescente a 
renda mensal(em reais) de 8 trabalhadores da construgao civil. 


500 

550 

550 

550 

600 

600 

700 

1750 


Neste exemplo, ha n = 8 observagbes. Portanto, a mediana sera obtida como: 




X(4) + X( 5 ) 

2 


550 + 600 
2 


575, 


isto e, a media aritmetica entre a quarta (x( 4 ) = 550) e a quinta (x( 5 ) = 600) 
observagbes que resulta em 575. Neste caso, note que um trabalhador com renda 
mediana ganha 150 reais a rnenos do que um trabalhador com renda media que e 
igual a ( x obs = 725). 
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Nas situagoes em que a mediana e exatamente igual a media, diz-se que os dados tem 
distribuigao simetrica, ou seja, a probabilidade de sortear um numero do conjunto 
de dados e este estar localizado abaixo da media (mediana) e igual a 50%. Um modo 
direto de mensurar a simetria na distribuigao dos dados e calcular a diferenga entre a 
mediana e a media, quanto mais proximo de zero for este resultado, maior a simetria 
no conjunto de dados.. 


Moda 

A moda observada ( mo 0 b s ) e simplesmente o valor mais freqiiente em um conjunto 
de dados. Considere o seguijnte conjunto de dados:3; 4; 5; 7; 7; 7; 9; 9. Temos mo 0 b s = 7, 
pois o valor 7 e aquele que ocorre com a maior freqiiencia. 

A moda e uma medida de tendencia central que pode ser calculada para qualquer 
tipo de variavel, seja ela quantitativa ou qualitativa. Veja o exemplo a seguir. 

Exemplo 1.11. Em uma amostra de pacientes em um labor atorio foram observados os 
tipos sanguineos encontrados em 1000 exames, com os seguintes resultados mostrados na 
Tabela 1.7. 


Tabela 1.7: Tipos sanguineos de 1000 pacientes. 


Tipo de Sangue 

Freqiiencia Absoluta(nj) 

O 

497 

A 

441 

B 

123 

AB 

25 

Total 

1000 


Para estes dados, a moda observada e o sangue do tipo O, pois este e o mais freqiiente. 
Cabe ressaltar que, para esta variavel, apenas podemos calcular esta medida de tendencia 
central. 

Pode ocorrer a situagao em que existam duas rnodas, como por exemplo para o 
conjunto A = {3, 4, 4, 5, 5, 6, 7, 8} . Neste caso, os valores 4 e 5 sao os mais freqtientes. O 
conjunto e dito ser bimodal. 

Quando o conjunto possui mais do que duas modas ele e dito ser multimodal. 

Outra situagao extrema e aquela em que a moda nao existe tal como ocorre para o 
conjunto B = {3, 4, 5, 6, 7, 8, 9} cujas freqiiencias estao distribuidas uniformemente entre 
os diferentes valores, ou seja, nestes dados cada valor tem freqiiencia igual a 1 e o conjunto 
e dito ser amodal. 


1.2. Tecnicas de estati'stica descritiva 


17 


Medidas de dispersao 

Muito embora as medidas de tendencia central sejam utilizadas como o primeiro 
resumo numerico de urn conjunto de dados, a sua representatividade esta diretamente 
ligada com a variabilidade. Veja o Exemplo 1.12 a seguir. 

Exemplo 1.12. Ao aplicar a mesma prova em dois grupos de 4 alunos cada, foram obtidos 
os resultados: 


Notas da Turma A 


aluno 

1 

2 

3 

4 

nota 

5 

5 

5 

5 


Notas da Turma B 


aluno 

1 

2 

3 

4 

nota 

10 

0 

10 

0 


Ao utilizar a media, mediana e moda para resumir as informagoes das duas turmas, 
repare que os resultados coincidem (Tabela 1.8). A nota media e 5 e, em ambas as turmas, 
50% dos alunos tern nota igual ou abaixo da media. 

Embora as turmas sejam iguais em relagao as medidas de tendencia central, a hete- 
rogeneidade da turma B e rnaior, ou seja, a variabilidade das notas e maior nestes alunos. 
Isto faz com que a media da turma B, seja menos representativa do que a media da turma 
A, que realmente reflete o conhecimento dos 4 alunos. 

Tabela 1.8: Medidas de tendencia central para as notas das turmas A e B. 



Media 

Mediana 

Moda 

Turma A 

5 

5 

nao existe 

Turma B 

5 

5 

nao existe 


As medidas de dispersao servern para quantificar a variabilidade dos valores em um 
conjunto de dados. Uma medida de tendencia central para ser nrelhor compreendida deve 
estar acompanhada de uma medida de dispersao. 

Nesta segao, serao apresentadas 5 medidas de dispersao (ver Tabela 1.9) para va- 
riaveis quantitativas, sendo que 4 delas utilizam a media como referenda: desvio medio 
absoluto, variancia, desvio padrao e coeficiente de variagao. 

Amplitude total 

Esta medida e obtida a partir da diferenga entre o maximo(x( n )) e o rmnimo (xn)) 
em um conjunto de dados ordenados. Esta medida possui o valor 0 como limite inferior e 
e altamente sensivel a valores extremos. 
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Tabela 1.9: Principals medidas de dispersao. 


Medidas 

Notagao 

Amplitude Total 

^ obs 

Desvio absoluto medio 

dam 0 b s 

Variancia 

var obs 

Desvio padrao 

dpobs 

Coeficiente de Variagao 

CV Q bs 


A obs — ^(n) *E(1)- 

Para o Exemplo 1.12, o valor calculado para esta medida foi A obs = 0 para a turma A 
e A obs = 10 para a turma B. A diferenga entre as amplitudes das duas turmas e a maxima 
que poderia ocorrer. A turma A tern menor variabilidade possivel, pela amplitude total, 
enquanto a turma B tern a maior variabilidade possivel de ser encontrada com o uso desta 
medida. 

A grande limitagao da amplitude total e quantificar a variabilidade com apenas 
o uso de duas observagoes; maximo e minimo. Outras medidas exploram com maior 
profundidade o conjunto de dados e, apresentaremos na seqiiencia, 4 medidas baseadas no 
desvio em relagao a media. 

Desvio medio absoluto 

E simplesmente o calculo da media dos desvios absolutos. Para o seu calculo, primei- 
ramente deve ser calculada a media ( x obs ), posteriormente os desvios d* das observagoes 
em relagao a media e, por ultimo, a media do modulo destes desvios conforme a formula 
a seguir. 

n 

dma obs = ^ 
i= 

Exemplo 1.13. Em uma prova, os alunos obtiveram as seguintes notas: 5; 6; 9; 10; 10. 
Obtenha o desvio medio absoluto. 

, |5 — 8| + |6 — 8| + |9 — 8| + 1 10 — 8| + 1 10 — 8| n 

c lttiOjqJjs — — 2 . 

5 

Algo importante sobre esta medida, assirn como a variancia, desvio padrao e o 
coeficiente de variagao e que todas sao calculadas usando como referenda de tendencia 
central a media ( x obs ). 

Exemplo 1.14. Urn estudo sobre aleitamento materno investigou o peso de 10 nascidos 
vivos cuja media observada foi x obs = 3, 137. Cada um dos pesos e apresentado na Tabela 

1 . 10 . 
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Tabela 1.10: Peso de 10 nascidos vivos 


peso 2,50 

2,45 

4,15 

3,30 

2,86 

3,45 

3,48 2,33 

3,70 

3,15 

desvios -0,63 

-0,69 

1,01 

0,16 

-0,28 

0,31 

0,34 -0,81 

0,56 

0.01 


dma 0 bs 


0,63 + 0,69 + ... + 0,01 
10 


0,48 


A interpretagao desta medida para o Exemplo 1.14 indica que, em media, um nascido 
vivo tem peso 0,48kg distante da media observada que e 3,137kg. 


Variancia 

Esta e a rnais conhecida medida de variabilidade. Como sera visto mais adiante, em 
rnuitas situagoes o calculo de probabilidades depende exclusivamente do conhecimento da 
media e variancia de uma variavel na populagao. 

O calculo da variancia assemelha-se com o do dma obs , pois utiliza desvios quadra- 
ticos em vez dos absolutos. Assirn, a variancia tambem e chamada de media dos desvios 
quadraticos. 


var obs 


E (Xi — X ob sY 

n 


1=1 

Para o mesrno conjunto de dados do Exemplo 1.13, a variancia observada e igual a: 


(5 — 8) 2 + (6 — 8) 2 + (9 — 8) 2 + (10 — 8) 2 + (10 — 8) 2 , , 

var obs = = 4, 4. 

5 

Propriedades da variancia: 

1. A variancia de um conjunto de numeros iguais e sempre 0. 

2. Ao multiplicar todos os valores do conjunto por uma constante, a variancia fica 
multiplicada por esta constante ao quadrado. 

3. Ao somar uma constante a todos os valores de um conjunto, a variancia nao se altera. 

Exemplo 1.15. O conjunto de notas do Exemplo 1.13 deve ser multiplicado por 10 para 
que este possa ser langado no boletim. Deste rnodo, o novo conjunto e: 50, 60, 90, 100, 100 
Qual a variancia das notas langadas no boletim ? 

Solugao: Basta multiplicar a variancia encontrada anteriormente por 100. 

Por utilizar a media corno referenda, o desvio absoluto medio e a variancia tambem 
sao afetados por valores extremos. No caso da variancia o efeito e ainda maior pois os 
valores estao elevados ao quadrado. 
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Desvio padrao 

Embora seja uma medida importante, a variancia carece de interpretagao pois e uma 
medida dos valores ao quadrdado. Isto e contornado com o uso do desvio padrao que e 
obtido pelo calculo da raiz quadrada da variancia. 


dpobs s/vaTobs 


\ 


(Xi %obs)^ 


i= 1 


n 


A grande vantagem do desvio padrao e que este possibilita analisar a variabilidade 
na mesma escala em que os dados forarn medidos. Se a variavel ern questao e peso (kg), 
o desvio padrao e expresso em kg, ao contrario da variancia que e expressa em kg 2 . 


Coeficiente de Variagao 

O coeficiente de variagao e a razao entre o desvio padrao e a media. Esta e uma 
medida relativa que avalia o percentual de variabilidade em relagao a media observada. 
Uma das grandes vantagens desta medida e a possibilidade de comparar a variabilidade 
de conjuntos medidos em diferentes escalas. 


CV 0 bs 100 x 


dpobs 

%obs 


Exemplo 1.16. Urn exame fisico examinou 6 indivfduos cujos pesos(kg) foram:68; 70; 86; 
55; 75 e 90. No mesmo exame, foram tambem tomadas medidas de altura (cm), com os se- 
guintes valores:170; 160; 164; 164; 170 el80. Os indivfduos apresentam maior variabilidade 
no peso ou altura? 

Como as unidades de medida sao diferentes, utilizaremos o coeficiente de variagao 
como medida de comparagao entre os dois conjuntos. 


Resumo 

Peso (Kg) 

Altura (cm) 

media 

74 

168 

desvio padrao 

11,65 

6,43 

coeficiente de variagao 

15,7% 

3,83 % 


A partir dos coeficientes de variagao constatamos que os indivfduos apresentam 
maior variabilidade no peso. 

Separatrizes 

As separatrizes sao valores de referenda em um conjunto de valores ordenados e, 
portanto, sao aplicadas a variaveis quantitativas e qualitativas ordinais. A mediana md 0 b s 
e um exemplo destas medidas, pois separa o conjunto de dados em dois subconjuntos, com 
as menores e maiores observagoes. 
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Se o interesse e subdividir o conjunto ordenado em 4 partes de igual tamanho, serao 
necessarios 3 valores para estabelecer esta separagao. Estes valores sao chamados quartis. 
O primeiro quartil (Qi) estabelece o lirnite entre as 25% menores observagoes e as 75% 
maiores. O segundo quartil {Q 2 = md 0 b s ) e igual a mediana e o terceiro quartil ( Q3 ) 
separa as 75% menores observagoes das 25% maiores. 

Em urn conjunto ordenado de observagoes de uma variavel X(i),X( 2 ),. • . ,x ( n ), o pri- 
meiro e o terceiro quartis podern ser obtidos avaliando as quantidades Q\ = ^( 2 .) e 
Q 3 = respectivamente. Tais quantidades sao avaliadas mediante interpolagdes 

conforme o Exemplo 1.17. 

Exemplo 1.17. Diametros de 9 pegas sao medidos em milimetros, com os seguintes re- 
sultados: 


xi = 3 x 2 = 1, 5 X 3 = 2, 5 X 4 = 3, 5 X 5 = 4 xg = 2 x 7 = 3, 5 x 8 = 2 xg = 1, 5. 


e a amostra ordenada e representada da seguinte maneira: 


X(i) = 1,5 X( 2 ) = 1,5 X( 3 ) = 2 X( 4 ) = 2 X( 5 ) =2,5 x (6) = 3 x (7) = 3, 5 x (8) = 3, 5 x (9) = 4. 


O primeiro e terceiro quartis sao encontrados pelos numeros x/ 2 , 25 ) e x ( 6 , 75 )- Repare 
que o primeiro quartil e um valor que fica entre X( 2 ) e ^( 3 ), entretanto rnais proximo de 
X( 2 )- Realizando uma interpolagao, avaliamos esta quantidade da seguinte forma: 

Ql = x (2,25) = x {2) + R 25 [x (3) — X(2)] = 1, 625. 
e, segundo o mesmo raciocinio, tambem avaliamos o terceiro quartil: 

Q 3 = a: (6,75) = x (6) + 75[x( 7) - x (6) ] = 3, 375. 

Caso o interesse seja dividir o conjunto de dados em 10 partes iguais, serao necessa- 
rios 9 numeros, chamados de decis. Para calcular um decil, utilizamos a formulagao: 

X(in\ i = 1, 2, 3, . . . , 9 

'■ICO 

e interpolamos os valores de forma similar ao que foi mostrado para os quartis. 

1.2.3 Graficos 

Muitas vezes as informagoes contidas em tabelas podem ser rnais facilmente enten- 
didas se visualizadas em graficos. Gragas a proliferagao dos recursos graficos, existe hoje 
uma infinidade de tipos de graficos que podem ser utilizados. 

No entanto, a utilizagao de recursos visuais deve ser feita cuidadosamente; um grafico 
desproporcional em suas medidas pode conduzir a conclusoes equivocadas 

Vamos abordar tres tipos basicos de graficos: setores ou pizza, barras e histograma. 
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Grafico de setores ou pizza 

Este grafico e adequado para representar variaveis qualitativas. Sua construgao 
consiste ern repartir um disco era setores cujos angulos sao proporcionais as freqiiencias 
relativas observadas nas categorias da variavel. 

Exemplo 1.18. Uma pesquisa de intengao de votos para os partidos A,B,C e D, realizada 
com 100 eleitores resultou na Tabela 1.11. 


Tabela 1.11: 

Intengao de votos para 

os partidos A,B,C e D 

Partido 

Freqiiencia Absoluta 

Freqiiencia Relativa 

A 

40 

0,4 

B 

30 

0,3 

C 

20 

0,2 

D 

10 

0,1 

Total 

100 

1 


Conforme a Figura 1.1 a maior fatia corresponde ao partido A que detern 40% 
das intengdes de voto. Embora tal informagao esteja na Tabela 1.11, a assimilagao das 
diferengas entre as intengdes de votos e rnais rapida no grafico de setores. 


lnten9oes de Voto 


partido A 



Figura 1.1: Grafico de setores para a intengao de votos nos partidos A,B,C e D. 
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Grafico de barras 

Este grafico representa a informagao de uma tabela de freqiiencias simples e, por- 
tanto, e mais adequado para variaveis discretas ou qualitativas ordinais. Utiliza o piano 
cartesiano com os valores da variavel no eixo das abscissas e as freqiiencias no eixo das 
ordenadas. 

Para cada valor da variavel desenha-se uma barra com altura correspondendo a 
sua freqiiencia. E importante notar que este grafico sugere uma ordenagao dos valores 
da variavel, podendo levar a erros de interpretagao se aplicado a variaveis quantitativas 
nominais. 

Exemplo 1.19. Urn posto de saude content um cadastro das famflias regularmente aten- 
didas ern que consta o numero de criangas por famflia. Ao resumir esta informagao para 
todas as famflias em que ha no maximo 5 criangas e obtida a Tabela 1.12. 


Tabela 1.12: Numero de criangas por famflia. 


Numero de criangas 

Freqiiencia Absoluta 

Freqiiencia Relativa 

0 

52 

0,302 

1 

38 

0,221 

2 

43 

0,25 

3 

22 

0,128 

4 

11 

0,064 

5 

6 

0,035 

Total 

172 

1 


A representagao grafica da Tabela 1.12 e apresentada na Figura 1.2. A altura de 
cada barra e diretamente proporcional ao numero de famflias com a quantidade de filhos 
especificada no eixo das abcissas. 

Histograma 

O histograma e um grafico que possibilita o primeiro contato com a formato da 
distribuigao dos valores observados. Precede a sua construgao a organizagao dos dados de 
uma variavel quantitativa em faixas de valores. 

Consiste em retangulos contfguos com base nas faixas de valores da variavel e com 
area igual a freqiiencia relativa da faixa. A altura de cada retangulo e denominada den- 
sidade de freqiiencia ou simplesmente densidade definida pelo quociente da freqiiencia 
relativa pela amplitude da faixa 2 . 

2 Alguns autores usam a freqiiencia absoluta ou porcentagem na construgao do histograma. O uso da 
densidade impede que o histograma fique distorcido quando as faixas tem amplitudes diferentes. 
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0 1 2 3 4 5 

numero de filhos 


Figura 1.2: Grafico de barras para o numero de filhos por famflia. 


Ha 3 elementos que determinam a configuragao da tabela de freqtiencias em faixas 
de valores e do histograma: 

• L - Numero de faixas de valores 

• h - Comprimento dos intervalos de classe 

• A 0 b s - Amplitude total. 

com a seguinte relagao entre eles: 

L ~~r- 

Conforme ja foi comentado, nao existe uma regra definitiva para a determinagao 
destes elementos. Entretanto, algumas formulagdes para L, o numero de faixas de valores, 
sao utilizadas com bastante freqiiencia em pacotes computacionais. Dentre estas formu- 
las, varnos citar duas de facil aplicagao que dependem somente de n, a quantidade de 
observagoes: 

1. Formula de Sturges 

L = 1 + 3, 31ogn. 


2. Raiz quadrada de n 
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Assim como o grafico de setores e o grafico de barras sao construidos a partir de 
uma tabela de frequiiencias simples, o histograma e construido a partir de uma tabela de 
freqiiencias em faixa de valor es. 

Exemplo 1.20. Um determinado teste mede o nivel de estresse por uma escala de valores 
que varia continuamente de 0 a 13. Uma empresa aplicou o teste a 70 funcionarios obtendo 
os seguintes result ados: 


Tabela 1.13: Nivel de estresse em 70 funcionarios de uma empresa. 


Nivel de estresse 

Freqiiencia Absoluta ( rii ) 

Freqiiencia Relativa ( ft ) 

0-2 

5 

0,07 

2-4 

10 

0,14 

4-6 

13 

0,19 

6-8 

16 

0,23 

8-10 

11 

0,16 

10-12 

9 

0,13 

12-14 

6 

0,09 

Total 

70 

1 


A informaqbes da Tabela 1.13, com L = 7 faixas de valores para a variavel nivel de 
estresse, sao diretamente transpostas para o grafico histograma conforme a Figura 1.3. 


nivel de estresse 



i 1 1 1 1 1 1 1 

0 2 4 6 8 10 12 14 


estresse 


Figura 1.3: Histograma para o nivel de estresse. 
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Box-plot 

0 Box- Whisker Plot, mais conhecido por box-plot, e uma ferramenta grafica apro- 
priada para resumir o conjunto de observagoes de uma variavel contmua. Este grafico 
revela varios aspectos dos dados, dentre eles: tendencia central, variabilidade e simetria. 
O boxplot tambern possibilita visualizar valores atipicos (outliers). 

A construgao do box-plot e feita com base no chamado resumo de cinco numeros: o 
minimo, o primeiro quartil(Qi), a mediana ( md 0 b s ), o terceiro quartil (Q 3 ) e o maximo. 
Apos calcular estes cinco numeros em urn conjunto de dados observados, eles sao dispostos 
de acordo com a Figura 1.4. 


Max 


Q3 


md 


Q1 


Min 


Figura 1.4: Desenho esquematico do box-plot com base no resumo de 5 numeros. 

A parte central do grafico e composta de uma “caixa” com o nivel superior dado por 
Q 3 e o nivel inferior por Q\ . O tamanho da caixa e uma medida de dispersao chamada 
amplitude interquartilica ( AIQ = Q 3 — Qi)- 

A mediana, medida de tendencia central, e representada por um trago no interior 
da caixa e segmentos de reta sao colocados da caixa ate os valores maximo e minirno. 

Exemplo 1.21. Suponha que um produtor de laranjas, que costuma guardar as frutas 
em caixas, esta interessado em est.udar o nrimero de laranjas por caixa. Apos um dia de 
colheita, 20 caixas forarn contadas. Os resultados brutos, apos a ordenagao, foram: 

22 29 33 35 35 37 38 43 43 44 48 48 52 53 55 57 61 62 67 69 


Para esses dados ternos o resumo de 5 numeros apresentados na Tabela 1.14. 
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Tabela 1.14: Resumo de 5 numeros para o numero de laranjas por caixas. 


Mediana Observada ( md 0 b s ) 

46 

Primeiro Quartil (Qi) 

36,50 

Terceiro Quartil (Q 3 ) 

55,50 

Mfnimo (x(x)) 

22 

Maximo (»( 2 o)) 

69 


Na Figura 1.5 e apresentado para esses dados o box-plot com base no resumo de 5 
numeros. 




Q3 




Q1 




Figura 1.5: Box-plot do numero de laranjas nas 20 caixas. 


A representagao grafica no box-plot informa, dentre outras coisas, a variabilidade e 
simetria dos dados. Na Figura 1.5, a distribuigao dos dados esta muito proxima da perfeita 
simetria pois: a diferenga entre a mediana(46) e a media(46,55) e pequena e a distancia 
da mediana para os quartis e a mesma. 

Outra possibilidade na construgao do box-plot e utilizar nas extremidades dos tragos 
adjacentes a caixa urn criterio para identificar observagbes atfpicas. Este criterio e baseado 
na amplitude interquartis(A/(5 = Q 3 — Qi). A esquematizagao que utiliza este criterio e 
apresentada na Figura 1.6. 

No exemplo das laranjas, nao ha valores fora destes limites e, quando isto ocorre, os 
limites sao representados pelo mmimo e maxirno conforme a Figura 1.4. 


28 Conceitos Basicos e Tecnicas de Estati'stica Descritiv a 


Correa da Rosa, J. M. 


-Q3+1 ,5AIQ 

Q3 

md 

Q1 


-Q1-1 ,5AIQ 


Figura 1.6: Desenho esquematico do box-plot com base nos quartis e criterio para valores 
ati'picos. 


O box-plot pode tambern ser utilizado corno ferramenta de analise bivariada. O 
exemplo na Figura 1.7 compara alturas de criangas dos sexos masculino e feminino. Os 
dados utilizados apra elaboragao dessa figura estao na tabela 1.15 
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Tabela 1.15: Alturas de criangas do sexo masculino (m) e feminino (f). 


crianga 

altura 

sexo 

crianga 

altura 

sexo 

i 

99.00 

m 

39 

118.00 

f 

2 

115.00 

m 

40 

118.00 

m 

3 

114.00 

f 

41 

86.00 

m 

4 

133.00 

m 

42 

124.00 

m 

5 

106.00 

m 

43 

113.00 

m 

6 

160.00 

m 

44 

121.00 

f 

7 

96.00 

m 

45 

92.00 

m 

8 

96.00 

m 

46 

104.00 

m 

9 

127.00 

f 

47 

75.00 

f 

10 

110.00 

f 

48 
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m 

11 

111.00 

f 

49 

105.00 

f 

12 

128.00 

f 

50 

102.00 

f 

13 

107.00 

f 

51 

96.00 

m 

14 

134.00 

f 

52 

96.00 

f 

15 

109.00 

f 

53 

113.00 

m 

16 

104.00 

f 

54 

88.00 

m 

17 

106.00 

m 

55 

100.00 

m 

18 

117.00 

m 

56 

152.00 

f 

19 

147.00 

m 

57 

88.00 

f 

20 

132.00 

m 

58 

108.00 

m 

21 

148.00 

f 

59 

120.00 

m 

22 

80.00 

f 

60 

93.00 

f 

23 

91.00 

f 

61 

98.00 

m 

24 

107.00 

f 

62 

110.00 

f 

25 

79.00 

f 

63 

108.00 

m 

26 

127.00 

m 

64 

119.00 

m 

27 

107.00 

m 

65 

93.00 

f 

28 

123.00 

m 

66 

116.00 

m 

29 

91.00 

f 

67 

98.00 

m 

30 

119.00 

m 

68 

108.00 

m 

31 

75.00 

m 

69 

91.00 

m 

32 

75.00 

m 

70 

109.00 

f 

33 

101.00 

m 

71 

97.00 

m 

34 

105.00 

f 

72 

115.00 

m 

35 

97.00 

m 

73 

88.00 

m 

36 

100.00 

f 

74 

58.50 

m 

37 

116.00 

m 

75 

88.00 

m 

38 

127.00 

m 

76 

103.00 

f 


30 Conceitos Basicos e Tecnicas de Estatistica Descritiva 


Correa da Rosa, J. M. 



Figura 1.7: Altura de criangas confer me o sexo. 


A partir do box-plot por categorias, pode-se constatar as diferengas nas tendencias 
centrais dos grupos pelo posicionamento do trago central na caixa. Neste exemplo, a altura 
mediana dos meninos e ligeiramente maior do que a das meninas. Por outro lado, quando 
comparamos a variabilidade nos dois conjuntos, por meio dos tamanhos das caixas, nao 
ha evidencia, sob o aspecto visual, de diferenga entre os sexos feminino e masculino. 

Outro aspecto que pode ser visto no grafico e a existencia de pontos discrepan- 
tes {outliers) nas alturas de meninos e meninas. E importante ressaltar que ao separar os 
valores de altura por sexo, podem surgir pontos discrepantes que nao eram evidentes nos 
dados agregados, pois eles sao identificados em relagao a tendencia central e variabilidade 
do grupo ao qual pertence. E bem provavel que uma menina cuja altura e discrepante 
em relagao as outras meninas, nao se destaque em relagao as alturas de todas as criangas 
pois, ao incluir meninos, a medida de tendencia central e aumentada. 

Grafico seqiiencial 

As observagoes provenientes de uma serie temporal em geral apresentam mudangas 
na media e variancia ao longo do tempo que podem resultar de algum tipo de tendencia 
no comportamento da variavel. Este fato pode ser verificado descritivamente no grafico 
seqiiencial. A construgao do grafico consiste em plotar o par de valores (x,y), em que x 
representa um fndice de tempo (espago) e y o valor observado da variavel correspondente 
aquele fndice. 

A Figura 1.8 exibe dados da variagao mensal da taxa SELIC durante o perfodo de 
1995 ate 2005. No grafico podemos observar perfodos de maior turbulencia em que a taxa 
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SELIC apresenta maior variabilidade. Por este conjunto de dados apresentar aspectos tipi- 
cos de uma serie temporal, devemos tomar extremo cuidado ao calcular resumos numericos 
pois estes podem variar em fungao do perfodo de tempo em que sao calculados. 



Anos 


Figura 1.8: Variagao mensal na Taxa Selic no periodo de 1995 a 2005. 


Exemplo 1.22. Uma importante rede de lojas registra durante um ano a quantidade (em 
milhares) de eletrodomesticos vendidos. 


mes 

jan 

fev 

mar 

abr 

mai jun 

jul 

ago 

set 

out 

nov 

dez 

vendas de 












eletrodomesticos 

25 

23 

17 

14 

11 13 

9 

10 

11 

9 

20 

22 


A evolugao das vendas ao longo do tempo e melhor entendida no grafico seqiiencial 
apresentado na Figura 1.9. Repare que apos o mes de janeiro ha uma tendencia de queda 
que e revertida novamente nos ultimos meses do ano. 
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Figura 1.9: Grafico sequencial das vendas ao longo dos meses. 


Capitulo 2 


Teoria das Probabilidades 


2.1 Introducao 

No capitulo anterior, foram mostrados alguns conceitos relacionados a estatistica 
descritiva. Neste capitulo apresentamos a base teorica para o desenvolvimento de tecnicas 
estatisticas a serem utilizadas nos capitulos posteriores. 

Vamos considerar as seguintes questoes: Como saber se um determinado produto 
esta sendo produzido dentro dos padroes de qualidade? Como avaliar a capacidade de 
um determinado exanre acertar o verdadeiro diagnostico? Questbes conro estas envolvem 
algum tipo de variabilidade ou incerteza, e as decisoes podem ser tomadas por meio da 
teoria de probabilidades que pernrite a quantificagao da incerteza. 

A seguir, veremos alguns conceitos basicos de probabilidade. 

2.2 Conceitos Basicos de Probabilidade 

• Fenomeno Aleatorio: E um processo de coleta de dados ern que os resultados possiveis 
sao conhecidos mas nao se sabe qual deles ocorrera. Assirn, um fenomeno aleatorio 
pode ser a contagem de ausencias de um funcionario em um determinado nres, o 
resultado do langamento de uma moeda, verificar o resultado de um exanre de sangue, 
entre outros. 

• Espago Amostral: O conjunto de todos os resultados possiveis do fenomeno aleatorio 
e chanrado de espago amostral. Vamos representa-lo por O. 

Exemplo 2.1. Langamento de uma moeda. 0 = {cara, coroa}. 

Exemplo 2.2. Langamento de um dado. O = {1, 2, 3, 4, 5, 6}. 

Exemplo 2.3. Nunrero de chips defeituosos em uma linha de produgao durante 24 horas. 
Q = {0, 1, 2, 3, ... , n}, sendo n o nunrero nraxinro de itens defeituosos. 

Exemplo 2.4. Tempo de reagao de unra pomada anestesica aplicada em queinrados. f 1 
= {t G K | t> 0 }. 
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• Evento: Qualquer subconjunto do espago amostral Q e chamado de evento. Serao 
representados por letras maiusculas A, B, . . . . Dentre os eventos podemos considerar 
o evento uniao de A e B, denotado por A U B, que, equivale a ocorrencia de A, ou de 
B, ou de ambos. A ocorrencia simultanea dos eventos A e B, denotada por AflBe 
chamada de evento intersegao. Dois eventos A e B dizem-se mutuamente exclusivos 
ou disjuntos, quando a ocorrencia de urn deles impossibilita a ocorrencia do outro. 
Os dois eventos nao tem nenhum elemento em comum, isto e, A n B = 0 (conjunto 
vazio) . 

Exemplo 2.5. Suponha um fenomeno aleatorio conduzido com a finalidade de se conhecer 
a eficiencia de uma terapia na cura de uma sindrome. Para tanto, dois pacientes forarn 
tratados com a referida terapia. Vamos representar C e C, como curado e nao curado, 
respectivamente. O espago amostral nesse caso e dado por: 

n = { cc , cc, cc, oc}. 

Considere os seguintes eventos: A “obter uma cura” e B “obter quatro curas”: Sendo 
assim, ternos: 

A = {CC, CC} 

e 

5 = 0. 

2.2.1 Definigao classica de probabilidade 

Em fenomenos aleatorios tais como langamento de uma moeda, de um dado, extra- 
gao de uma carta de um baralho entre outros, temos que todos os resultados possiveis tem 
a mesrna chance de ocorrer. Assim, por exemplo no langamento de uma moeda a probabi- 
lidade do evento cara ou coroa ocorrer sao igualmente provaveis, ou seja, a probabilidade 
atribufda a cada um e 1/2. 

A probabilidade de um evento A qualquer ocorrer pode ser definida por: 

„ , . , mimero de casos favoraveis ao evento A 

P(A) = 7 -7 — • 

nurnero de casos possiveis 

Exemplo 2.6. Considere o fenomeno aleatorio langamento de um dado e o evento A “sair 
nurnero par”. Qual a probabilidade deste evento ocorrer? 

P(A) = l = 0,50. 
b 

Na maioria das situagoes praticas, os resultados nao tem a mesrna chance de ocorrer, 
deste rnodo, a probabilidade dos eventos deve ser calculada pela frequencia relativa. 
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2.2.2 Aproximagao da Probabilidade pela frequencia relativa 

Quando nao se tem conhecimento sobre as probabilidades dos eventos, estas podem 
ser atribufdas apos repetidas observagbes do fenomeno aleatorio, ou seja, a proporgao de 
vezes que um evento A qualquer ocorre pode ser estimada como segue: 

numero de ocorrencias do evento A 
numero de observagoes 

Exemplo 2.7. Uma escola particular pretende oferecer um treinamento esportista aos 
seus alunos. Dos 300 alunos entrevistados, 142 optaram pelo voleibol, 123 indicaram o 
basquete e 35 indicaram o futebol. Selecionado aleatoriamente um desses alunos, qual a 
probabilidade de obter alguem que prefere o voleibol? 


P{V) 


142 

300 


0,47333. 


A medida que o numero de observagbes aumenta, as aproximagoes tendem a ficar 
cada vez rnais proximas da probabilidade efetiva. 


2.2.3 Propriedades de probabilidades 

E uma fungao P(.) que associa numeros reais aos elementos do espago amostral e 
satisfaz as condigoes: 

1. 0 < P(A) < 1, para qualquer evento A; 

2. P(O) = 1; 

3. P(0) = 0; 

n 

4. P(U ] = 1 Aj) = ^ P(Aj). 

i=i 

Se A for o evento complementar de A, entao P(A) = 1 - P(A). 

2.2.4 Teorema da soma 

Dado dois eventos A e B, a probabilidade de pelo menos um deles ocorrer e igual a 
soma das probabilidades de cada um menos a probabilidade de ambos ocorrerem simulta- 
neamente, ou seja: 

P{A U B) = P(A) + P(B) - P(A n B). 

Se A e B forem mutuamente exclusivos, teremos P(AnB) = 0. Assirn, 


P(AUB) = P(A) + P(B). 
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Exemplo 2.8. Considere o experimento langamento de um dado e os seguintes eventos: 
A = {sair numero 5}, 

B = {sair numero par} e 
C = {sair numero fmpar}. 

Determinar: Q, P(A), P(B), P(C), P(AuB), P(AuC) e P(A). 


n 

P{A) 
P(B) 
P(C) 
P(A U B) 
P(A U C) 
P(A) 


{ 1 , 2 , 3 , 4 , 5 , 6 }. 


1 

6 ' 

3 

6 ' 

3 

6 ' 

1 3 _ 
6 + 6 ~ 
1 3 

6 + 6 ~~ 

1 

1 - - = 
6 


4 

6 ' 

1 

6 

5 

6 ' 


3 

6 ' 


Exemplo 2.9. Um estudo realizado por uma empresa de recursos humanos mostrou que 
45% dos funcionarios de uma multinacional sairam da empresa porque estavam insatisfeitos 
com seus salarios, 28% porque consideraram que a empresa nao possibilitava o crescimento 
profissional e 8% indicaram insatisfagao tanto com o salario corno com sua impossibilidade 
de crescimento profissional. Considere o evento S: “o funcionario sai da empresa em razao 
do salario” e o evento I: “o funcionario sai da empresa em razao da impossibilidade de 
crescimento profissional”. Qual e a probabilidade de um funcionario sair desta empresa 
devido a insatisfagao com o salario ou insatisfagao com sua impossibilidade de crescimento 
profissional? 


P(SUI) = P(S) + P(I) - P(S n I) 
P(SUI) = 0,45 + 0,28 - 0,08 = 0,65. 


2.2.5 Probabilidade condicional 

Existem situagoes em que a chance de um particular evento acontecer depende do 
resultado de outro evento. A probabilidade condicional de A dado que ocorreu B pode ser 
determinada dividindo-se a probabilidade de ocorrencia de ambos os eventos A e B pela 
probabilidade do evento B; como se mostra a seguir: 


P{A | B) 


P{AnB) 

P{B) 


P{B) > 0. 


2.2. Conceitos Basicos de Probahilidade 


37 


Exemplo 2.10. Em uma universidade foi selecionada uma amostra de 500 alunos que 
cursaram a disciplina de Estatfstica. Entre as questoes levantadas estava: Voce gostou da 
disciplina de Estatfstica? De 240 homens, 140 responderam que sim. De 260 mulheres, 200 
responderam que sim. Para avaliar as probabilidades podemos organizar as informagbes 
em uma tabela. maneira: 

Tabela 2.1: Gosto pela disciplina de estatfstica segundo sexo. 



Gostou 


Sexo 

Sim 

Nao 

Total 

Homem 

140 

100 

240 

Mulher 

200 

60 

260 

Total 

340 

160 

500 


Qual e a probabilidade de que um aluno escolhido aleatoriamente: 
(a) H = Seja um homem? 


P(H) = — = 0,48. 
^ 7 500 


(b) G = Gostou da disciplina de Estatfstica? 


(c) M = Seja uma mulher? 


P(C) = ^=0,6 8 . 


P(M) = — = 0,52. 
^ 7 500 


(d) NG = Nao gostou da disciplina de Estatfstica? 

mG ) = | 2 =°, 3 2 . 

(e) Seja uma mulher ou gostou da disciplina de Estatfstica. 

260 340 200 

P(M U G = + = 0, 80. 

V 7 500 500 500 

(f) Seja uma mulher e gostou da disciplina de Estatfstica. 

P(M nG) = = 0, 40. 

(g) Dado que o aluno escolhido gostou da disciplina de Estatfstica. Qual a probabilidade 
de que o aluno seja um homem? 

P(rnr , P(ffnG) 140 

P{H 1 G) ~ P(G) ~ 340 - °' 41176 ' 

(h) Dado que o aluno escolhido e uma mulher. Qual a probabilidade de que ela nao gostou 
da disciplina de Estatfstica? 


P(NG | M) 


P(NGnM) 

P(M) 


60 

260 


0, 23077. 
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2.2.6 Teorema do produto 

Da definicao de probabilidade condicional P(A\B) = 1 jsrgp- podemos obter o teo- 
rema do produto, que nos permite calcular a probabilidade da ocorrencia simultanea de 
dois eventos. Sejarn A e B eventos de fi, a probabilidade de A e B ocorrerem juntos e 
dada por: 


P(A n B) = P(A) P(B\A ), com P(A) > 0 


ou 


P(A nB) = P(B) P(A\B), com P(B) > 0. 

Dois eventos A e B sao independentes quando a ocorrencia de um nao altera a 
probabilidade de ocorrencia do outro. Desse modo, 

P{AnB) = P{A) P{B). 

Exemplo 2.11. Uma empresaria sabe por experiencia, que 65% das mulheres que corn- 
pram ern sua loja preferem sandalias plataformas. Qual e a probabilidade de as duas 
proximas clientes comprarem cada uma delas, uma sandalia plataforma? Vamos admi- 
tir que o evento A “a primeira cliente cornpra uma sandalia plataforma” e o evento B “a 
segunda cliente cornpra uma sandalia plataforma”. Entao, 

P(A n B) = (0, 65)(0, 65) = 0, 4225. 

2.2.7 Teorema da probabilidade total 

Suponha que os eventos C±, C 2l ■ ■ ■ , C n formam uma partiqao do espago amostral. 
Os eventos nao tern intersegoes entre si e a uniao destes e igual ao espago amostral. Seja 
A um evento qualquer desse espago, entao a probabilidade de ocorrencia desse evento sera 
dada por: 

p(A) = P(A n Cl) + P{A n c 2 ) + ■ • • + P{A n c n ) 

e usando a definigao de probabilidade condicional, 

P(A) = P(Ci) P(A\C!) + P(C 2 ) P(A\C 2 ) + • • • + P(C n ) P{A\C n ). 

Exemplo 2.12. Uma caixa I contem 2 fichas verdes e 3 vermelhas. Uma segunda caixa 
II contem 4 fichas verdes e 3 vermelhas. Escolhe-se, ao acaso, uma caixa e dela retira-se, 
tambem ao acaso uma ficha. Qual a probabilidade de que a ficha retirada seja verde? Se 
denotarmos por I e II o evento caixa I e caixa II, respectivamente e V o evento a ficha e 
verde, temos: P(I) = ±, P(V\I) = f, P(II) = \ e P(V\II) = f. 

Desta forma, o evento V (“ficha verde”) pode ser escrito em terrnos de intersegoes 
do evento V com os eventos I e II, 
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v = (v n i) u (v n 

P(V) = 


Exemplo 2.13. Um estabilizador pode provir de tres fabricantes I, II e III com probabili- 
dades de 0,25, 0,35 e 0,40, respectivamente. As probabilidades de que durante determinado 
perfodo de tempo, o estabilizador nao funcione bem sao, respectivamente, 0,10; 0,05 e 0,08 
para cada um dos fabricantes. Qual e a probabilidade de que um estabilizador escolhido ao 
acaso nao funcione bem durante o periodo de tempo especificado. Se denotarmos por A o 
evento “um estabilizador nao funcione bem” e por C\, C 2 e C 3 os eventos “um estabilizador 
vem do fabricante I, II e III”, respectivamente. A probabilidade de que um estabilizador 
escolhido ao acaso nao funcione bem durante o periodo de tempo especificado e: 




(P{vni)) + (P(vnii) 

P(I)(P(V\I)) + (P(II)P(V\II) 

- - + = 0,48571. 

2 5 2 7 


P(A) = P^P^Ci) + P(C 2 )P(A\C 2 ) + P(C 3 )P(A\C 3 ) 

= (0, 25) (0, 10) + (0, 35) (0, 05) + (0, 40)(0, 08) = 0, 07450. 


2.2.8 Teorema de Bayes 

Considere C\, C 2 , ..., C n eventos que formarn uma partigao do espago amostral fl, 
cujas probabilidades sao conhecidas. Considere que para um evento A se conhegam as 
probabilidades condicionais, desta forma: 


P(Cj\A) 


P(Cj) PjAlCj) 

P{Ci) P(A\Ci) + P(C 2 ) P(A\C 2 ) + • ■ ■ + P(C n ). P{A\C n ) ’ 


j = 1,2, ...,n. 


Exemplo 2.14. Considere o exemplo anterior para o desenvolvimento do Teorema de 
Bayes. Dado que o estabilizador escolhido ao acaso nao funciona bem durante o periodo 
de tempo especificado, qual a probabilidade de que tenha sido produzido pelo fabricante 
I, isto e, P(Ci|A). 


mi a) 


P(Ci) P^IO) 


P(C f i)P(A|C 1 ) + P(C 2 )P(A\C 2 ) + P(C 3 )P(A\C 3 ) 
(0, 25)(0, 10) 


0, 07450 


= 0,33557. 


Capftulo 3 


Variaveis Aleatorias 


3.1 Introducao 

Neste capftulo vamos dar continuidade ao estudo de probabilidades, introduzindo os 
conceitos de variaveis aleatorias e de distributes de probabilidade. 

Uma variavel aleatoria (v.a.) associa um valor numerico a cada resultado de um 
fenomeno aleatorio e uma distribuigao de probabilidade associa uma probabilidade a cada 
valor de uma variavel aleatoria. Como exemplos, podemos citar: o numero de usuarios 
que consultam um site de busca, em um certo tempo do dia, o numero de atletas com 
lesoes traumaticas no joelho, o numero de ovos de codorna incubados durante um perfodo, 
o tempo de uso de uma maquina agrfcola, a pressao sangufnea de mulheres na menopausa, 
dentre outros. Uma v.a. pode ser classificada como variavel aleatoria discreta ou variavel 
aleatoria contfnua. 

3.2 Variavel Aleatoria Discreta 

Uma variavel aleatoria que pode assumir um numero finito de valores ou uma quan- 
tidade enumeravel de valores, cujas probabilidades de ocorrencia sao conhecidas e deno- 
rninada variavel aleatoria discreta. 

A fungao que atribui a cada valor da variavel aleatoria sua probabilidade e denomi- 
nada fungao discreta de probabilidade ou fungao de probabilidade, isto e: 

P(X = Xi) = p(xi ) = Pi, i = 1,2,... 

Uma fungao de probabilidade satisfaz as duas condigoes seguintes: 

i) 0 < pi < 1; 

ii) Eft = 1 - 

Exemplo 3.1. Um pediatra de um hospital publico constatou que das criangas internadas 
durante um ano, 20% nao tiveram internamento por infecgao da faringe, 45% tiveram um 
internamento por infecgao da faringe, 25% tiveram dois internamentos por infecgao da 
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faringe, 9% tiveram tres internamentos por infecgao da faringe e 1% tiveram quatro inter- 
namentos por infecgao da faringe. Seja X uma variavel aleatoria discreta que representa o 
niimero de internamentos por infecgao da faringe. Logo, a fungao de probabilidade para 
X e dada na tabela a seguir: 


X 

0 

1 2 

3 

4 

Pi 

0,20 

0,45 0,25 

0,09 

0,01 


No exemplo temos: 0,20 + 0,45 + 0,25 + 0,09 + 0,01 = 1. 


3.3 Variavel Aleatoria Continua 

Uma variavel aleatoria que pode tornar um niimero infinito de valores, e esses va- 
lores podern ser associados a mensuragoes em uma escala continua e as probabilidades 
necessarias ao seu estudo sao calculadas como a area abaixo da curva da distribuigao, e 
chamada de fungao de densidade de probabilidade. Como exemplos de variaveis aleatorias 
contfnuas, podemos citar: o tempo de uso de um equipamento eletronico; medidas do 
torax, diametro de um cabo de video, tempo de atendimento a clientes; altura, peso, etc. 

Uma fungao de densidade de probabilidade f(x) pode ser usada para descrever a 
distribuigao de probabilidades de uma variavel aleatoria continua X, se satisfaz: 
i)f(x) > 0 , para todo x E (—00,00); 

/ OO 

f(x)dx = 1. 

-OO 

3.4 Esperanca Matematica 

Seja X uma variavel aleatoria. A esperanga matematica, media ou valor esperado 
de X e definida por: 

OO 

E(X) = p = X XiP(xi), se X for discreta. 

2=1 

/ OO 

xf{x)dx , se X for continua. 

-OO 

Exemplo 3.2. As probabilidades de um corretor de imoveis vender uma sala comercial 
com lucro de R$ 3500,00, de R$ 2500,00, R$ 800,00 ou com um prejuizo de R$ 500,00 sao 
0,20, 0,35, 0,22 e 0,10, respectivamente. Qual e o lucro esperado do corretor de imoveis? 
Sendo 


x\ = 3500, X 2 = 2500, X 3 = 800 e X4 = —500 


e 


Pi = 0, 20, P 2 = 0, 35, p 3 = 0, 22 e p 4 = 0, 10 
tem-se E(X) = 3500(0, 20) + 2500(0, 35) + 800(0, 22) - 500(0, 10) = 1801 
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3.5 Variancia 

A variancia de uma variavel aleatoria X e dada por: 

Var{X ) = a 2 = E(X) 2 - [E{X)} 2 . 

3.6 Principals Distribuicoes de Probabilidades 

A distribuigao de probabilidade de uma variavel descreve corno as probabilidades 
estao distribuidas sobre os valores da variavel aleatoria. A seguir veremos as distribuigbes 
de probabilidade Bernoulli, Binomial e Poisson para variaveis aleatorias discretas e a 
distribuigao Normal para uma variavel aleatoria continua. 

3.6.1 Distribuigao de Bernoulli 

Em situagoes ern que o fenomeno aleatorio e realizado uma so vez e a variavel de 
interesse assume somente dois valores, tais como: urn gestor de informagao reconhece uma 
determinada editora ou nao, um paciente sobrevive a run transplante de medula ossea ou 
nao, um equipamento eletronico e classificado como bom ou defeituoso. Estas situagoes 
tern alternativas dicotomicas, ou seja, podem ser representadas por respostas do tipo 
sucesso com probabilidade p que se atribui o valor 1 ou fracasso com probabilidade q que 
se atribui o valor 0. Podemos definir estes experimentos como ensaios de Bernoulli. 

Uma variavel X tem distribuigao de Bernoulli e sua fungao discreta de probabilidade 
e dada por: 


P(X = x)= p x q 1 ~ x , x = 0,1. 

Exemplo 3.3. Uma caixa tem 20 bolas azuis e 30 verdes. Retira-se uma bola dessa caixa. 
Seja X o numero de bolas verdes. Determinar P(X). 

Para x = 0 ternos q = = 0, 4 e para x = 1, p = = 0, 6. 

Logo, P(X = x) = 0, 6 X 0, A 1 ~ x . 

3.6.2 Distribuigao Binomial 

Consideremos n tentativas independentes de ensaios de Bernoulli. Cada tentativa 
admite apenas dois resultados complementares: sucesso com probabilidade p ou fracasso 
com probabilidade q, de modo a se ter p + q = 1 . As probabilidades de sucesso e fracasso 
sao as mesmas para cada tentativa. A variavel aleatoria X que conta o numero total de 
sucessos e denominada Binomial. 

Para indicar qua a variavel aleatoria X segue o modelo Binomial, usaremos a notagao 
X ~ b(n, p), ern que n e p sao denominados parametros dessa distribuigao. A sua fungao 
de probabilidade e dada por: 
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em que 


P(X = x ) 



p x q 


n—x 


x = 0,1,2, ... ,n, 


f n\ n\ 

\x) x\(n — x)\ 

sendo 

n = numero de tentativas, 
x = numero de sucessos, 
p = probabilidade de sucesso, 
q = probabilidade de fracasso e 

P(x)= a probabilidade de se obter exatamente x sucessos em n provas. 


Para uma variavel aleatoria X com distribuigao binomial a media e sua variancia sao 
dadas, respectivamente, por: 

p = E{X) = np ; e a 2 = npq. 


Exemplo 3.4. Uma rnoeda e langada 6 vezes. Qual a probabilidade de: 

a) Exatamente duas caras ocorrerem? 


P(X = 2) = 0, 5 2 0, 5 6-2 = 0, 23438. 

b) Ocorrerem pelo menos 4 caras? 

P(X >4) = P(X = 4) + P(X = 5) + P(X = 6) 

= Q 0, 5 4 0, 5 6-4 + Q 0, 5 5 0, 5 6-5 + Q 0, 5 6 0, 5 6 " 6 
= 0, 23438 + 0, 09375 + 0, 01563 = 0, 34375. 

c) Pelo menos 1 cara? 


P{X >1) = 1 - P(X = 0) 

P(X> 1) = Qo,5°0,5 6 -° 

P{X > 1) = 1 -0,01563 = 0,98438. 

Exemplo 3.5. Num municipio, ha uma probabilidade de 0,70 de uma empresa de ma- 
terials reciclaveis ter seguro contra incendio; qual a probabilidade de que, dentre cinco 
empresas: 

a) Nenhuma tenha seguro contra incendio? 

P(X = 0) = Q 0, 7°0, 3 5-0 = 0, 00243. 

b) Exatamente quatro tenham seguro contra incendio? 

P(X = 4) = Q 0, 7 4 0, 3 5 " 4 = 0, 36015. 
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3.6.3 Distribuigao de Poisson 

Como aplicagoes da distribuigao de Poisson podemos citar estudos de acidentes com 
veiculos; numero de mortes por derrame cerebral por ano, numa cidade, numero de recla- 
rnagoes que chegam em uma operadora telefonica por hora, numero de clientes que chegam 
numa loja durante uma hora de promogao relampago e numero de usuarios de computador 
ligados a Internet. 

A distribuigao de Poisson e uma distribuigao discreta de probabilidade, aplicavel a 
ocorrencia de urn evento em um intervalo especificado (tempo, distancia, area, volume ou 
outra unidade analoga). A probabilidade do evento ocorrer x vezes em um intervalo e 
dada a seguir: 


em que A e a media (A = np) ou o numero esperado de ocorrencias num determinado 
intervalo de tempo, por exemplo. Utilizaremos a seguinte notagao: X rs_/ Po(A). 

Exemplo 3.6. O numero de mulheres que entram diariamente em uma clinica de estetica 
para bronzeamento artificial apresenta distribuigao de Poisson, com media de 5 mulheres 
por dia. Qual e a probabilidade de que em um dia particular, o numero de muheres que 
entram nesta clinica de estetica para bronzeamento artificial, seja: 
a) Igual a 2? 



r.2 -5 

P(X = 2) = — — = 0, 08422. 

b) Inferior ou igual a 2? 


P(X < 2) 


5°e" 5 | S^- 5 _ 5 2 e -5 
0 ! + 1 ! + 2 ! 


= 0, 12465. 


3.6.4 Distribuigao Normal 

A distribuigao Normal e a mais importante distribuigao de probabilidade para des- 
crever variaveis aleatorias contfnuas. Isto justifica-se pelo grande numero de aplicagoes 
que a utilizam tais corno, altura, pressao arterial, medidas de testes psicologicos, tempo de 
vida util de um dispositivo eletronico, temperatura corporal, dentre outras. Alem disso, 
pela sua capacidade de aproximar outras distribuigdes e tambem pela grande aplicagao na 
inferencia estatistica. 

A variavel aleatoria continua X com distribuigao Normal tem fungao de densidade 
de probabilidade dada por: 

X (x-ii ) 2 

f(x) = — e ; para — oo < x < oo 

V 27T(J 

em que os parametros pea representam a media e o desvio padrao, respectivamente. 
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Usaremos a notagao X ~N(p, a 2 ), para indicar que a variavel aleatoria X tem 
distribuigao Normal com parametros pea 2 . 

Algumas caracteristicas da distribuigao normal sao: 

• a curva normal tem forma de sino, e simetrica em relagao a media, como representada 
na Figura 3.1; 

• a media, mediana e moda sao valores coincidentes; 

• a variavel aleatoria X associada a sua distribuigao varia de — oo < x < oo; 

• a fungao f(x) tem ponto maxirno em x = p. 



Figura 3.1: Densidade Normal. 

Para o calculo das probabilidades, surgem dois problemas: primeiro, a integragao de 
f(x), pois para a sua resolugao e necessario o desenvolvimento em series; segundo, seria 
a elaboragao de uma tabela de probabilidades, pois f{x) depende das combinagdes da 
media e variancia. Para resolver esses problemas, optou-se por uma mudanga de variavel 
obtendo-se, assirn, a distribuigao normal padronizada que chamamos aqui de Z. 

3.6.5 Distribuigao Normal Padrao 

Denomina-se distribuigao Normal Padrao a distribuigao Normal de media zero e 
variancia 1, usaremos a notagao Z ~ N{ 0, 1). As probabilidades associadas a distribuigao 
normal padrao sao apresentadas em tabelas. A tabela da normal padrao que iremos 
utilizar fornece a probabilidade de Z tomar um valor nao superior a z, esta apresentada 
no Apendice. 

3.6.6 Uso da tabela da Normal Padrao 

Com o uso da tabela da distribuigao Normal Padrao pode-se encontrar as probabi- 
lidades de Z. Vejamos alguns exemplos: 
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Exemplo 3.7. P (Z < 1). 

A probabilidade que esta sendo pedida esta representada na area sombreada sob 
a curva normal exibida na figura abaixo. Portanto, com auxilio da tabela chega-se ao 
resultado 0,84134. 



Exemplo 3.8. P (Z < -1). 

Neste caso a probabilidade que esta sendo pedida esta a esquerda de -1. Portanto, 
com auxilio da tabela chega-se ao resultado 0,15865. 



Exemplo 3.9. P (Z < 1,72)= 0,95728. 


Exemplo 3.10. 
Exemplo 3.11. 
Exemplo 3.12. 
Exemplo 3.13. 


P (Z < -0,53)= 0,29805. 

P (-1 < Z < 1) = 0,84134 - 0,15865 = 0,68269. 

P (0,7 < Z < 1,35) = 0,91149 - 0,75803 = 0,15346. 
P (Z >1,8) = 0,03593. 
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Os problemas da vida real, entretanto, nao se apresentam ja na forma reduzida, 
ao contrario, sao formulados em termos da variavel normal original X, com media p e 
desvio padrao a. E preciso entao, antes de passarmos a sua resolugao, padronizamos ou 
reduzimos a v.a. Normal X, transformando-a na v.a. Z. 

O resultado da padronizagao e a obtengao de uma escala de distribuigao denominada 
escala reduzida, escore Z, que rnede o afastamento das variaveis em relagao a media em 
numero de desvios-padrao. 


Z = ^, 
a 

em que: 

Z representa o numero de desvios-padrao a contar da media; 
x representa urn valor qualquer da variavel aleatoria; 

[i = media da distribuigao; 
a = desvio padrao da distribuigao. 

Exemplo 3.14. As vendas diarias de um confeitaria no centra de uma cidade tern distri- 
buigao normal, com media igual R$ 450,00 por dia e desvio padrao igual a R$ 95,00. Qual 
e a probabilidade das vendas excederem R$ 700,00 em determinado dia? 

Sendo Z = ' 00 90 5()0 = 2, 63 e utilizando a tabela da Normal padrao, encontramos a proba- 
bilidade de 0,00426 para o valor de Z = 2, 63. 

Exemplo 3.15. Suponha que entre pacientes o nivel de colesterol tenha uma distribuigao 
aproximadamente Normal de media 105 mg por 100 ml e um desvio padrao 9 mg por 
100 ml. Qual a proporgao de diabeticos que tern m'veis entre 90 e 125 mg por 100 ml? 

Como Z = 90 ~q 105 = —1,67 e Z = 125 9 105 = 2,22 temos a partir da tabela da Normal 
padrao as seguintes probabilidades: 0,98679 para o valor de Z = 2, 22 e 0,04745 para o 
valor de Z = —1,67. Desse modo, a proporgao de diabeticos e 93,93. 


Capitulo 4 


Inferencia Estatfstica - Teoria da 
Estimagao 

4.1 Introducao 

Neste capitulo aboi'daremos situagdes em que o interesse esta em obter informagdes 
da populagao a partir dos resultados de uma amostra. Como exemplo, consideremos uma 
industria de produtos de cabelo que pretende investigar a aceitagao, entre as mulheres, de 
seu novo produto tonalizante. Para tanto, selecionamos uma amostra aleatoria de mulheres 
que utilizaram o produto e verificamos qual e o percentual de aprovagao desse produto na 
amostra. Outro exemplo trata-se de um psiquiatra interessado em determinar o tempo 
de reagao de um medicamento anti-depressivo em criangas. Uma amostra aleatoria de 
criangas que utilizaram o medicamento e obtida e analisamos o tempo medio de reagao. 
Nestes dois exemplos, deseja-se determinar o valor de um parametro por rneio da avaliagao 
de uma amostra. 

A seguir vamos definir alguns conceitos basicos de inferencia estatfstica. 

• Parametro: e uma rnedida numerica, em geral desconhecida, que descreve uma carac- 
terfstica de interesse da populagao. Sao representados, geralmente, por letras gregas 
tais corno, p (media populacional), a (desvio-padrao populacional) , entre outros. 
Neste texto, usaremos a letra p para representar a proporgao populacional. 

• Estatfstica: e qualquer valor calculado a partir dos dados amostrais. Por exemplo, X 
(media amostral), S (desvio-padrao amostral) ep (proporgao amostral). A estatfstica 
e uma variavel aleatoria, por dois motivos: porque e uma quantidade incerta (antes 
de obter a amostra nao sabemos seu valor) e porque seu valor varia de amostra 
para amostra. E claro que, quando uma amostra e selecionada e uma estatfstica 
e calculada, torna-se entao uma constante, ou seja, e o resultado da observagao de 
uma variavel aleatoria. 

• Estimador e Estimativa: uma estatfstica destinada a estimar um parametro e cha- 
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mada estimador. Dada uma amostra, o valor assumido pelo estimador e chamado 
de estimativa ou valor estimado do parametro. As estimativas obtidas por rneio da 
estati'stica variam de acordo com a amostra selecionada. 

Os procedimentos basicos de inferencia estati'stica compreendem duas metodologias. 
Uma e chamada de estimagao, na qual nos usarnos o resultado amostral para estimar o 
valor desconhecido do parametro; a outra e conhecida corno teste de hipoteses, em que 
nos usarnos o resultado amostral para avaliar se uma afirmagao sobre o parametro (uma 
hipotese) e sustentavel ou nao. Teoria de estimagao e o assunto principal deste capitulo e 
teste de hipoteses sera retomado no proximo capitulo. 

Para motivagao, consideremos uma populagao formada por 5 alunos. Temos infor- 
rnagoes sobre a idade e sexo dos alunos na Tabela 4.1. 


Tabela 4.1: Populagao de alunos. 


Identificagao 
dos alunos 

Idade 

em anos completos 

Sexo 

feminino(f); masculino(m) 

1 

22 

f 

2 

19 

f 

3 

19 

m 

4 

20 

f 

5 

22 

m 


A populagao de alunos tern, em media, p = 20, 4 anos com variancia a 2 = 1, 84 anos 2 
(desvio-padrao a = 1,36 anos, aproximadamente) . Verificamos que 40% dos alunos sao 
homens, ou seja, a proporgao de homens e p = 0,40. A idade media, o desvio-padrao de 
idade e a proporgao de homens descrevem a populagao de alunos, portanto sao parametros. 

Embora tenhamos acesso a todos os dados de sexo e idade dos 5 alunos, vamos re- 
correr a amostragem para estimar p por X, a idade media amostral, e p por p, a proporgao 
amostral de homens. 

Na Tabela 4.2 estao relacionadas todas as amostras possiveis de tamanho dois, que 
podern ser selecionadas da populagao dos 5 alunos, por amostragem aleatoria simples com 
reposigao. Sao 5 2 = 25 possiveis amostras. Para cada amostra i, podemos calcular Xj, 
uma estimativa para a idade media e pi, uma estimativa para a proporgao de homens. 
Temos estimativas variadas para p e p, e e o que ocorre quando tiramos varias amostras 
de uma populagao. Nenhuma das estimativas coincide com o valor do parametro. Por 
exemplo, a amostra i = 4, formada pelos alunos 1 e 4, apresenta uma superestimativa 
para a idade media, X 4 = 21 anos, e subestima a proporgao de homens, p^ = 0, 0. Ja na 
amostra i = 8, em que foram selecionados os alunos 2 e 3, a idade media e subestimada em 
A§ = 19 anos, e a proporgao de homens e superestimada em = 0, 5. Nesta ilustragao, 
estamos medindo o erro das estimativas, pois o valor do parametro e conhecido, situagao 
que nao acontece nos problemas reais de estimagao. 
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Tabela 4.2: Todas as possiveis amostras aleatorias simples com reposigao de tamanho 2, 
da populagao de alunos. 


Amostra 

i 

Alunos 

selecionados 

Dados 

amostrais 

X* 

Pi 

1 

1 e 1 

22 f, 22 f 

22,0 

0,0 

2 

1 e 2 

22 f, 19 f 

20,5 

0,0 

3 

1 e 3 

22 f, 19 m 

20,5 

0,5 

4 

1 e 4 

22 f, 20 f 

21,0 

0,0 

5 

1 e 5 

22 f, 22 m 

22,0 

0,5 

6 

2 e 1 

19 f, 22 f 

20,5 

0,0 

7 

2 e 2 

19 f, 19 f 

19,0 

0,0 

8 

2 e 3 

19 f, 19 m 

19,0 

0,5 

9 

2 e 4 

19 f, 20 f 

19,5 

0,0 

10 

2 e 5 

19 f, 22 m 

20,5 

0,5 

11 

3 e 1 

19 m, 22 f 

20,5 

0,5 

12 

3 e 2 

19 m, 19 f 

19,0 

0,5 

13 

3 e 3 

19 m, 19 m 

19,0 

1,0 

14 

3 e 4 

19 m, 20 f 

19,5 

0,5 

15 

3 e 5 

19 m, 22 m 

20,5 

1,0 

16 

4 e 1 

20 f, 22 f 

21,0 

0,0 

17 

4 e 2 

20 f, 19 f 

19,5 

0,0 

18 

4 e 3 

20 f, 19 m 

19,5 

0,5 

19 

4 e 4 

20 f, 20 f 

20,0 

0,0 

20 

4 e 5 

20 f, 22 m 

21,0 

0,5 

21 

5 e 1 

22 m, 22 f 

22,0 

0,5 

22 

5 e 2 

22 m, 19 f 

20,5 

0,5 

23 

5 e 3 

22 m, 19 m 

20,5 

1,0 

24 

5 e 4 

22 m, 20 f 

21,0 

0,5 

25 

5 e 5 

22 m, 22 m 

22,0 

1,0 


Com os resultados da Tabela 4.2 podemos calcular a media dos estimadores X e p. 
Media de X : 


Ei=i Xi 

15 


= 20,4 = [i 


Media de p: 


Li=i pi 
15 


= 0, 4 = p 


Nao foi por acaso que as medias de X e p coincidiram com os valores dos corres- 
pondentes parametros. Podemos demonstrar que a media dessas estimativas e igual ao 
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parametro que esta sendo estimado. 

Para as variancias de J e p, temos um outro resultado interessante. Denotando 
tamanho da amostra por n, podemos mostrar tambem que 
a variancia de X e: 


e a variancia de p e: 


a 

n 


P(1 ~P) 
n 

Verifique este resultados com os dados da Tabela 4.2. Nas formulas para a variancia 
dos estimadores, n aparece no denominador, isto quer dizer que quanto maior o tamanho 
da amostra, menos dispersas serao as estimativas. 

Quando obtemos todas as amostras de tamanho da populagao encontramos estima- 
tivas diferentes para o mesmo parametro, porem, em media, sao iguais ao parametro; e 
tendern a ser mais homogeneas com o aumento do tamanho da amostra. Este resultado e 
tao surpreendente, que torna possfvel o uso de uma amostra para estimar os parametros 
da populagao. 

Podemos propor varios estimadores para um determinado parametro. Para estimar, 
por exemplo, a media populacional p da variavel X, nos poderiamos usar a media amostral 
X, a mediana amostral, ou a primeira observagao Xi, entre outras possibilidades. Alguns 
estimadores em potencial nao tern sentido corno X±, que considera a primeira observagao 
como estimador de p e despreza toda a informagao proveniente das outras observagoes na 
amostra. Pode ser natural usar a estatistica analoga para estimar o parametro, ou seja, 
usar a media amostral para estimar p, mas esta estrategia nem sernpre leva ao rnelhor 
estimador. Basicamente, um bom estimador tern uma media igual ao parametro sendo 
estimado e desvio padrao pequeno. 


4.2 Propriedades dos Estimadores 

• Vicio 

Um estimador e nao viciado se sua media e igual ao parametro. A media amostral 
e um estimador nao viciado da media populacional. Por outro lado, um estimador 
viciado, em media, tende a subestimar ou sobrestimar o parametro. As vezes, pode 
ser interessante usar estimadores viciados, com vicios que tendern a desaparecer 
quando o tamanho da amostra aumenta. 

• Eficiencia 

Uma segunda propriedade interessante para um estimador e ter um erro padrao 
pequeno, comparado a outros estimadores. Um estimador com essa propriedade e 
dito ser eficiente. 
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E desejavel que o estimador de um parametro deva ser nao viciado e eficiente. Vimos 
que a media amostral e a proporgao amostral sao estimadores nao viciados para n e p, 
respectivamente; e e possfvel mostrar que sao estimadores eficientes. Por outro lado, 

,2 S-, (*.-*) 2 

n 

e um estimador viciado de a 2 e 

r 2 

n — 1 

e nao viciado. 

Uma boa maneira de visualizar as propriedades dos estimadores e fazer uma analogia 
com o jogo de dardos. Na Figura 4.1 estao esquematizados o desempenho de 4 jogadores, 
cada um com 8 dardos. Os dardos sao as amostras e os jogadores representam 4 tipos 
de estimadores. O jogador da Figura 4.1a representa um bom estimador, pois os dardos 
estao em torno do alvo (nao viciado) e bem concentrados (eficiente). Nas Figuras 4.1b a 
4. Id os jogadores nao tern um desempenho tao bom. Na Figura 4.1b esta representado 
o estimador rnais eficiente, comparando com os outros estimadores, mas tern vfcios. Ja o 
estimador caracterizado na Figura 4.1c nao tern vfcios porem, nao e eficiente. O jogador 
da Figura 4. Id representa o pior dos 4 estimadores: e viciado e nao pode ser considerado 
eficiente. 



Figura 4.1: Analogia entre as propriedades dos estimadores e o jogo de dardos. 


E importante estudar as propriedades do estimador para verificar se e um bom 
estimador para o parametro de interesse. Podemos tambem avaliar a qualidade de um 
estimador associando um erro maximo as estimativas. Este erro maximo e um limite que 
desejamos nao ser ultrapassado pela estimativa. Para verificar se um estimador e bom, 
basta calcular a probabilidade do erro amostral nao ultrapassar o maximo estipulado. 
Esperamos que essa probabilidade seja muito alta, perto de 100%. 

Na segao anterior, vimos que as estatfsticas e portanto os estimadores sao varia- 
veis aleatorias. A distribuigao de probabilidades de uma estatfstica e conhecida como 
distribuigao amostral e seu desvio-padrao e referido como erro padrao. Se conhecermos 
a distribuigao amostral do estimador podemos calcular as probabilidades que precisamos 
para avaliar o estimador. 
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4.3 Distribuicoes Amostrais 

4.3.1 Introdugao 

Uma forma de obter a distribuigao amostral de um estimador e pensarmos em todas 
as amostras possfveis de tamanho n que podem ser retiradas da populagao, usando por 
exemplo, amostragem aleatoria simples com reposigao, como foi feito para a populagao de 
5 alunos. Resumimos as informagoes sobre as estimativas da idade media na Tabela 4.2 
com a distribuigao de probabilidades para X (Tabela 4.3). 

Tabela 4.3: Distribuigao amostral da idade media. 


Possiveis 
valores de X 

Probabilidades 

19,0 

0,16 

19,5 

0,16 

20,0 

0,04 

20,5 

0,32 

21,0 

0,16 

22,0 

0,16 

Total 

1,00 


Por que e tao importante conhecer a distribuigao de XI Varnos lembrar que estamos 
procurando um bom estimador para /r, a media populacional. Alguern pode pensar que 
X e um bom estimador de fj, quando o erro amostral, X — //, for pequeno. Mas como /r 
e desconhecido nao e possivel mensurar o erro amostral. Varnos por um limite para esse 
erro amostral e varnos denota-lo por e. Se conhecermos a distribuigao de X e possivel 
calcular a probabilidade do erro amostral ser no maximo igual a e. Ja que o erro pode ser 
cometido para mais ou para rnenos, a probabilidade que devemos calcular e 

P (— e < X — n < e) . 


Se esta fosse a unica forma de obter a distribuigao amostral, o processo de inferencia 
ficaria inviavel para populagoes reais, pois e necessario obter todas as possiveis amostras 
de tamanho n para construir a distribuigao amostral. Felizmente, pela teoria de probabili- 
dades podemos mostrar que se uma variavel X tern distribuigao Normal, a media amostral, 
X, tambem tern distribuigao Normal. 

4.3.2 Distribuigao amostral de X 

Consideremos que uma amostra aleatoria de tamanho n e selecionada da populagao 
de interesse, para observar a variavel aleatoria continua, X, com distribuigao Normal de 
media [i e desvio-padrao a. A media amostral, X, tern distribuigao Normal com media /i 
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e desvio-padrao crj^/n. Tanto que 

7 = X - // 

ir/y/Ti 

tem distribuigao Normal Padrao. 

A Figura 4.2 apresenta a forma da distribuigao de X e de X para diferentes tamanhos 
de amostra. Observamos que a distribuigao de X na populagao e bem rnais dispersa que a 
de X] e a medida que aumentamos o tamanho da amostra, a distribuigao de X vai ficando 
mais concentrada. 



Figura 4.2: Distribuigao de X quando X tem distribuigao normal, para alguns tamanhos 
de amostra. 


Se a e desconhecido, a teoria de probabilidades rnostra que, mesmo assim, e possivel 
obter uma distribuigao amostral para X, utilizando uma distribuigao, denominada t de 
Student. Esta distribuigao tem forma parecida com a da Normal Padrao, com caudas 
urn pouco mais pesadas, ou seja, a dispersao da distribuigao t de Student e rnaior. Se 
uma distribuigao tem caudas mais pesadas, valores extremos tem rnaior probabilidade de 
ocorrerem. 

Esta dispersao varia com o tamanho da amostra, sendo bastante dispersa para arnos- 
tras pequenas, mas se aproximando da Normal Padrao para amostras grandes. A distri- 
buigao t de Student tem apenas um parametro, denominado graus de liberdade, gl. 


4.3. Distribuigdes Amostrais 
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Se uma variavel aleatoria X tem distribuigao Normal com media /r, entao 

T X-ix 
S/y/n 

tem distribuigao t de Student com (n — 1) graus de liberdade, sendo que S e o estimador 
de u, o desvio-padrao de X. 

Na Figura 4.3 estao representadas as densidades das distribuigdes de Z e T . 



Figura 4.3: Densidades de T e Z. 

Mesmo que a variavel de interesse X nao tenha uma distribuigao Normal, ainda 
podemos obter uma distribuigao aproximada para X. A teoria de probabilidades fornece 
urn teorema, que e urn dos resultados mais importantes da Estatfstica, pois encontra uma 
aproximagao para a distribuigao amostral de X, sem a necessidade de se conhecer muito 
sobre a populagao ern estudo. 

4.3.3 Teorema central do limite (TCL) 

Seja uma variavel aleatoria continua X com media /r e desvio-padrao a. Uma amos- 
tra aleatoria de tamanho n e selecionada da populagao de interesse, para observar X. 

Quando n e grande o suficiente (ern geral, n > 30), a media amostral, X, tem 
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distribuigao aproximadamente Normal com media fr e desvio-padrao cr/y/n. Assim, 

X — n 
cr/y/n 


tern aproximadamente distribuigao Normal Padrao. 

Se a e desconhecido, pode ser substitufdo por sua estimativa S, o desvio-padrao 
amostral, e mesrno assim, podemos entao dizer que 

X- n 
S/y/n 

tern aproximadamente distribuigao Normal Padrao. 

Exemplo 4.1. Como ilustragao do uso de distribuigoes amostrais, consideremos uma 
amostra aleatoria de n = 100 trabalhadores imigrantes, com a informagao sobre X, salario 
rnensal dessa amostra de trabalhadores. O salario medio rnensal da amostra, X =, e de 
1500 reais e e uma estimativa de /q o salario medio rnensal de todos os trabalhadores 
imigrantes. E o desvio-padrao amostral de salario, S =, e de 1200 reais. Os responsaveis 
pela pesquisa consideram que uma boa estimativa para o salario medio rnensal deve ter 
no maximo urn erro e de 200 reais. 

Vamos calcular a probabilidade do erro maximo ser de 200 reais, isto e, 


P (-200 < X — /j, < 200) . 


Para tanto, usaremos o TCL, ja que n 
probabilidade por 



100. Assim, dividindo todos os termos dentro da 


1200 

/too 


= 120 , 


teremos: 


P (-200 < X — /jl< 200) 



-1,67 < 


X-n 

120 


< 1,67 


Pelo TCL, 

X-fJL 

S/y/n 

tern aproximadamente distribuigao Normal Padrao. Podemos entao escrever: 


P 


-1,67 < 


X-fi 

120 


< 1,67 


^ P(-l,67 < Z < 1,67) = 0,905, 


obtida da tabela de distribuigao Normal Padrao, ja que Z tern exatamente a distribuigao 
Normal Padrao. 

Temos entao que: 

P (-200 <X-fi< 200) ^ 0, 905, 

ou seja, a probabilidade do erro amostral ser no maximo R$200,00 e aproximadamente 
igual a 90,5%. O valor 90,5% e conhecido como nivel de confianga. Em outras palavras, 
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nao podemos garantir que o erro maximo nao sera ultrapassado, mas temos 90, 5% de 
confianga que ele nao sera maior que R$200,00. 

Para aumentar o m'vel de confianga, e preciso aumentar n, o tamanho da amostra; 
ou diminuir e, o erro maximo. O processo de encontrar n, fixados o m'vel de confianga e 
o erro maximo, e urn problema de calculo de tamanho de amostra, apresentado na Segao 
4.9. O processo de encontrar e, fixados o tamanho de amostra e o m'vel de confianga, e 
urn problema de estimagao. Neste tipo de problema, fazemos o calculo da probabilidade 
ao contrario: temos o valor 0,905 e queremos encontrar 1,67. Os detalhes desse processo 
inverso sao vistos a partir da Segao 4.4. 

Ate o momento apresentamos uma estimativa do parametro baseado ern um unico 
valor, referido como estimativa pontual. Por exemplo, se a proporgao de mulheres com 
osteoporose em uma comunidade for estimada em 45%, essa estimativa e pontual pois 
se baseia em um unico valor numerico. Muitas vezes, entretanto, queremos considerar, 
conjunt ament e, o estimador e a sua variabilidade. A forma usual de incorporar esta 
informagao e por meio do chamado intervalo de confianga. 

Com uma amostra dispom'vel, nos podemos usar a distribuigao amostral do esti- 
mador para forrnar um intervalo de confianga, isto e, um intervalo de valores que deve 
conter o verdadeiro valor do parametro com uma probabilidade pre-determinada, referida 
por m'vel de confianga. Na estimagao por intervalo, acreditamos, com um certo m'vel de 
confianga, que o intervalo contern o valor do parametro. Um exemplo seria dizer que a 
proporgao de mulheres com osteoporose esta estimada entre 40% e 50% com um m'vel de 
95% de confianga. 

4.4 Estimacao da Media Populacional (/i) 

Consideremos uma populagao em que ha interesse em estimar /r, a media de X, uma 
variavel aleatoria contfnua. Suponhamos que uma amostra aleatoria de tamanho n foi 
selecionada da populagao para obter uma estimativa de fi. 

O estimador X e aquele que apresenta as melhores propriedades para estimar media 
populacional //. 

Para estimar, por intervalo, o parametro //, a partir de X. podemos pensar em 3 
condigoes diferentes. 

Condigao 1: Pelos resultados da Segao 4.3.2, se X ~ N(p,a 2 ) entao 

X-n 

cr/y/n 

tern distribuigao Normal Padrao. 

Como representado na Figura 4.4, podemos encontrar o valor de z, pela tabela da 
distribuigao Normal Padrao, tal que 


P (—z < Z < z) = 1 — a. 
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Figura 4.4: Densidade de Z e o quantil z. 


Assim, 


a/y/n 

Isolando fi nas desigualdades, temos que: 


P ( —2 < — 7 — J= < z ) = 1 — a. 


p(x-z-^=<h<X + z-^J]= 1-a. (4.1) 

V V™ y/nj 

Devemos ter algurn cuidado na interpretagao da probabilidade em (4.1). Entre as 
desigualdades esta o parametro //, e nao sao calculadas probabilidades de parametros, pois 
sao valores fixos. As partes aleatorias sao os limites do intervalo. A interpretagao para 
(4.1) e que com (1 — a) de confianga, o intervalo 


X — z — — ; X + z — -j= 
n \/n 


contem o parametro. 

O erro maxirno da estimativa, e, tambem conhecido como margem de erro, para urn 
nivel de confianga (1 — a), e dado por: 


a 

e = z— = 
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em que z pode ser obtido da tabela da Normal Padrao, em fungao do nfvel de confianga 
desejado. 

Condigao 2: Novamente X ~ N(p,a 2 ), mas e comum nao conhecermos o valor de 
(j, o desvio-padrao de X. Neste caso, usamos 

T X — p 

s/v^ 

que tern distribuigao t de Student com (n — 1) graus de liberdade. O valor de t pode ser 
encontrado usando a tabela da distribuigao t de Student, tal que 


P (—t < T < t) = 1 — a. 
Assim, reescrevendo (4.2) temos que: 

P ( -t < < t ) = 1 - a 


(4.2) 


S/y/n 

e isolando /i nas desigualdades, resulta em: 


P [ X - t4= < n < X + *4= 
\/n Jn 


= 1 — a. 


Urn intervalo de confianga de (1 — a) e entao: 




Condigao 3: Para o caso em que X nao segue uma distribuigao Normal, vamos 
supor que n seja suficientemente grande para a aplicagao do TCL. Entao: 


Z = 


X-n 


S/y/n ’ 

tern aproximadamente distribuigao Normal Padrao. 

Podemos entao escrever: 

P I -z < X ,7^- < z | ^ 1 -a. 


(4.3) 


S/y/n 

Isolando fi, chegamos ao intervalo: 


S - S 
X - z—j=\X + z—/= 
n \ n 


que e o intervalo de confianga aproximado de (1 — a) para estimar p. 

E para um nfvel de confianga (1 — a), o erro maxirno aproximado e 

5 


e = z 


n 


em que z pode ser obtido da tabela da Normal Padrao, em fungao do nfvel de confianga 
desejado. 
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Exemplo 4.2. Um centra de ortodontia deseja conhecer a estimativa do tempo medio que 
um membro da equipe gasta para atender a cada paciente. Suponha que uma amostra de 
38 especialistas revelou que a media foi de 45 minutos com um desvio-padrao de 6 minutos. 
Determine um intervalo de 99% de confianga para o parametro. 

Desejamos uma estimativa para o parametro desconhecido g, o tempo medio que um 
membro da equipe gasta para atender um paciente. Temos que n = 38, X = 45 e S = 6. 
Nao temos muita informagao sobre a distribuigao de X, o tempo gasto para atender um 
paciente, entao aplicaremos a Condigao 3. Para um nivel de confianga de 99%, o valor de 
z e 2,58. Portanto, o intervalo aproximado de 99% de confianga para g e 

( * + * 7 * ) = ( 45 - 2 - 48 + 2 - 58 ^) = (42 - 49; 47 - 51) ' 

Podemos dizer entao que o intervalo entre 42,49 e 47,51 content o tempo medio gasto por 
um membro da equipe para atender a cada paciente, com 99% de confianga. 

4.5 Estimacao de /j em Amostras Pequenas 

Quando dispomos de uma amostra pequena (n < 30), nao temos a garantia da 
aplicagao do TCL, portanto a distribuigao amostral da media pode ou nao estar proxima 
da distribuigao Normal. Mas se X tern distribuigao Normal podemos obter as estimativas 
intervalares de g, adotando a Condigao 1 ou 2. 

Na pratica, e dificil provar que uma variavel aleatoria X tern distribuigao Nor- 
mal. Porern, se X tern apenas uma moda e e basicamente simetrica, obtemos em geral, 
bons resultados, com intervalos de confianga precisos. Se ha forte evidencia de que a po- 
pulagao tern distribuigao bastante assimetrica, entao uma alternativa e utilizar metodos 
nao-parametricos, descritos no Capitulo 5 sobre teste de hipoteses, na Segao 5.7. 

Exemplo 4.3. Uma rede de lanchonetes deseja estimar a quantia media cjue cada cliente 
gasta por lanche. Foram coletados dados de uma amostra de 22 clientes que revelou uma 
quantia media de R$ 15 com um desvio-padrao de 5. Construir um intervalo de confianga 
de 95% para a media populacional. 

O objetivo e estimar o parametro fj,, a quantia media que cada cliente gasta por lanche, 
em todas as lanchonetes da rede. Assumindo que X, a quantidade gasta por lanche, tern 
distribuigao Normal, podemos usar a Condigao 2, ja que a e desconhecido. Podemos obter 
uma estimativa para o erro padrao da media por: 



Usando um nivel de 95% de confianga e 21 graus de liberdade ( gl = 21, pois n = 22 e 
gl = n — 1), obtemos na tabela da distribuigao t de Student o valor t = 2,08, e assim 
podemos calcular o erro maximo da estimativa 


4.6. Estimagao da Difereng a entre Duas Medias Populacionais ( fi\ e p. 2 ) 
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S 

e = t = 2, 08 • 1, 066 = 2, 217. 



Entao, temos o seguinte intervalo de 95% de confianga para o parametro p: 


X - t—-,x + t 




(15 - 2, 217; 15 + 2, 217) = (12, 783; 17, 217). 


O intervalo de 12,783 a 17,217 contem a quantia media que cada cliente gasta por lanche, 
com 95% de confianga. 

Pode parecer um pouco estranho que, com uma populagao distribuida normalmente, 
venhamos eventualmente a utilizar a distribuigao t de Student para achar os valores asso- 
ciados ao m'vel de confianga; mas quando u nao e conhecido, a utilizagao de S incorpora 
outra fonte de erro. Para rnanter o grau desejado de confianga compensamos a variabili- 
dade adicional ampliando o intervalo de confianga por um processo que substitui o valor 
z por um valor maior, t. Para ilustrar esta ideia considere para o Exemplo 4.3 um inter- 
valo de confianga de 95%, utilizando o valor z de uma distribuigao Normal Padrao. Este 
intervalo apresenta uma amplitude rnenor. 


4.6 Estimacao da Diferenca entre Duas Medias Populacio- 
nais ( fii e ( 12 ) 

Em muitas situagoes ha a necessidade de comparar duas populagoes diferentes. 
Como exemplos, podemos ter interesse em saber: se idosos que praticam exercfcios ff- 
sicos diariamente apresentam nfvel de colesterol rnenor do que idosos, com as mesmas 
condigoes, mas que nao praticam exercfcios ffsicos diariamente; se um tipo de equipa- 
rnente eletronico tern maior durabilidade do que outro; e assirn por diante. A seguir 
vamos utilizar um metodo para construir um intervalo de confianga para a diferenga entre 
duas medias, com duas amostras independentes. Para tanto, uma amostra aleatoria e 
selecionada independentemente de cada populagao. 

Seja X a variavel aleatoria a ser comparada. Suponhamos que X tenha media 
e desvio-padrao na Populagao 1 e tenha media ^2 e desvio-padrao a 2 na Populagao 2. 
Suponhamos tambem que as amostras tenharn tamanhos n\ e n 2 para as Populagoes 1 e 
2, respectivamente. 

Se ni e 712 > 30, podemos estender o resultado do TCL, tanto que (Ai — X 2 ) tern 
distribuigao aproximadamente Normal com media (ij - /12 e desvio-padrao 



Quando os parametros g\ e 02 sao desconhecidos podern ser substitufdos por 5i e 
S 2 , os desvios-padrao amostrais. 


(15 - 2, 089; 15 + 2, 089) = (12, 911; 17, 089). 
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Usando o mesmo processo para a construgao de intervalo de confianga para uma 
media, o intervalo de confianga aproximado para (fi\ — ^ 2 ) sera dado por: 


(X! - X 2 ) -zJ^ + (Xi - X 2 ) 
V n\ n 2 


lsf + sl 

ni n 2 


ern que o valor de z e encontrado na tabela da distribuigao Normal Padrao, conforme o 
nfvel de confianga do intervalo. 


Exemplo 4.4. Com o objetivo de comparar dois metodos de redugao de gordura localizada 
nas coxas, foram criados dois grupos, 1 e 2, cada urn com 30 pessoas que apresentam as 
mesmas condigoes, recebendo um tipo de tratamento. Antes e depois de um perfodo de 
60 dias de utilizagao do aparelho foi anotado a perda em mm. Obtendo-se: 


X\ = 21,3 ; S’, =2,6 


e 


X 2 = 13, 4 ; S 2 = 1,9, 

construir o intervalo de 95% de confianga para a diferenga de medias. 
A diferenga observada na amostra e 


X!-X 2 = 7,9 


e o intervalo: 


7,9 - 1,96 


2, 6 2 1, 9 2 

+ -b~;7,9 + l,96 


30 


30 


2, 6 2 1, 9 2 

+ 


30 


30 


= (6, 748; 9, 0527). 


e o intervalo de confianga de 95% para a diferenga entre as redugoes medias dos dois 
metodos. 


Quando o zero pertence ao intervalo de confianga, ha forte evidencia de que nao ha 
diferenga entre as duas medias populacionais. No Exemplo 4.4, com base no intervalo de 
confianga de 95%, podemos concluir que ha diferenga significativa entre a redugao media 
de gordura das coxas entre os dois metodos utilizados, pois o valor zero nao pertence ao 
intervalo de confianga. 


4.7 Estimacao de 74 — /12 em Amostras Pequenas 

Se ri\ ou n 2 e menor que 30, formas alternativas devern ser usadas para os intervalos 
de confianga. A teoria usada na Segao 4.5 pode ser estendida para o caso de duas amostras 
independentes. Assumimos normalidade para as distribuigoes populacionais, como no caso 


4. 7. Estimagao de /i\ — n 2 em Amostras Pequenas 
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de uma amostra. Alem disso, vamos assumir aqui que u\ = 0 2 , isso quer dizer que as duas 
populagoes tern o mesmo desvio-padrao, digamos, 0 . A variancia populacional a 2 pode 
ser estimada por: 


2 _ 0i - 1) S\ + (n 2 - 1) Si 
p n 1 + n 2 - 2 

que representa uma variancia combinada, pois e uma media ponderada das duas variancias 
amostrais, Sf e Sf. 

O intervalo de confianga para //1 — fi 2 sera dado por: 


('*■ - ^ + ® 

em que o valor de t e encontrado na tabela da distribuigao t de Student com (ni + n 2 — 2) 
graus de liberdade, conforme o nivel de confianga do intervalo. 

Quando nao podemos assumir que 01 = 02 , nao podemos combinar as variancias e 
os graus de liberdade da distribuigao t de Student nao sao tao simples de serern obtidos. 
A inferencia sobre fi\ — /r 2 , neste caso, e visto somente para teste de hipoteses na Segao 
5.4.4. 



Exemplo 4.5. O tempo para realizar uma tarefa, em segundos, foi anotado para 10 
homens e 11 nrulheres, igualmente treinados. As medias e variancias obtidas foram: 


Homem 

Mulher 

ni = 10 

n 2 = 11 

X\ = 45, 33 

A 2 = 43, 54 

S\ = 1,54 

Si = 2, 96 


Determine um intervalo de confianga de 99% para a diferenga entre os tempos rnedios 
de homens e nrulheres. 

Prinreiranrente, vamos calcular S 2 

o2 _ 9 x 1, 54 + 10 x 2, 96 _ o ori 

s p 

Na tabela da distribuigao t de Student com 19 gl encontramos que t = 2, 86, para 
99% de confianga. 

Como X\ — A 2 = 1, 79, o intervalo de confianga para (/ii — /x 2 ) sera dado por: 


^1,79 - 2,86 



; 1,79 + 2, 86 



(-0,10; 3, 68). 


Com base neste intervalo com 99% confianga, nao existe diferenga entre os tempos 
rnedios de honrens e nrulheres. 
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4.8 Estimacao de uma Proporcao Populacional (p) 

Nesta segao, as variaveis sao referentes a contagens, como o numero de fumantes, 
numero de unidades defeituosas em uma linha de produgao, e assim por diante. Primei- 
ramente, abordaremos a distribuigao amostral de p, em seguida a estimativa pontual do 
parametro p, a proporgao populacional, e, por ultimo, construiremos estimativas interva- 
lares. 

Consideremos o caso em que o parametro a ser estimado e a proporgao p de indivi- 
duos em uma populagao, que apresentam uma certa caracteristica. Retira-se da populagao 
uma amostra de tamanho n. Considerando a variavel Xi = 1, se o elemento i da populagao 
pertence a categoria de interesse, e X; = 0, se nao pertence a categoria, ternos que E7 =i 
sera o numero de elementos da amostra que apresentam a caracteristica em estudo. 

Para uma populagao de N elementos podemos calcular a proporgao populacional 

por: 


P = 


Ef =1 x t 

N 


Um estimador da proporgao populacional p sera a proporgao amostral p: 

U=1 Xi 


p = 


n 


Entao, o calculo de p e p e analogo ao de uma media e, portanto, e possivel aplicar 
o TCL para a proporgao amostral. 


4.8.1 TCL para proporgao amostral 

Seja uma amostra aleatoria de tamanho n, selecionada de uma populagao com pro- 
porgao populacional igual a p. Quando n e grande o suficiente (em geral, n > 30, se valor de 
p nao for muito proximo de 0 ou 1), entao p, a proporgao amostral, tern aproximadamente 
uma distribuigao Normal com media p e o desvio-padrao e: 


Vp( 1 ~P)/ n 


estimado por: 


Vp( l ~P)/n- 


Assim, 


p — p 

Vp( l ~P)/ n 


tem aproximadamente distribuigao Normal Padrao. 
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4.8.2 Intervalo de Confianga para p 

Para estimar, por intervalo, o parametro p, a partir de p, podemos seguir os mesmos 
princfpios da estimagao da media populacional. 

Suponhamos que n seja suficientemente grande para aplicar o TCL para proporgao. 
Temos que: 


P (—z < Z < z) = 1 — a => P — z < 


P~P 


<z “ 1 - a, 


^/p{l-p)/n 

ern que o valor de z e encontrado na tabela da distribuigao Normal Padrao. 
Isolando p nas desigualdades, resulta em: 


n |. Ip(1~P) ^ ^ , /P(l ~P) \ ^ , 

Pip — z Y < p < p + z y I = 1 — a. 

A probabilidade em (4.4) pode ser interpretada corno: o intervalo 


(4.4) 




n 


n 


estirna o parametro p , com aproximadamente (1 — a) de confianga. 
Urn intervalo de confianga conservative e: 


p - z 'lb i ’ +z \h 


A abordagem conservativa substitui o produto p( 1 — p) por 1/4. Como indicado 
na Figura 4.5, o produto p( 1 — p) e, no maximo igual a 1/4, de modo que ao usar 1/4, 
obtemos um intervalo de confianga rnais amplo. 

Encontrando 2 para um nfvel de confianga (1 — a), os erros maximos de estimagao 
na abordagem otimista e conservativa sao, respectivamente, dados por: 


e = z 


f>{ 1 -P) 


n 


e = z \ l — • 

V 4n 

Exemplo 4.6. Um especialista em educagao pretende avaliar a aceitagao de um projeto 
educacional numa cidade. Depois de apresenta-lo as escolas do muniefpio, os responsaveis 
por sua execugao desejam avaliar o valor aproximado do parametro p, a proporgao de dire- 
tores favoraveis ao projeto, dentre as escolas do muniefpio. Para estimar este parametro, 
o especialista planeja observar uma amostra aleatoria simples de n = 600 escolas. Se na 
amostra 420 sao favoraveis, temos a seguinte estimativa pontual para o parametro p: 
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P 


Figura 4.5: Maximo de p{ 1 — p). 


Usando um m'vel de 95% de confianga temos o seguinte intervalo otimista: 


0,7- 1,96 


0,70 • 0,30 
600 


; 0, 70 + 1,96 


0, 70 • 30 
600 


(0,663; 0,737). 


Ou seja, o intervalo de 66,3% a 73,7% contem, com 95% de confianga, a porcentagem de 
favoraveis ao projeto, dentre todas as escolas municipais. 


4.9 Determinacao do Tamanho da Amostra (n) 


Supondo que ha condigoes para aplicagao do TCL, as formulas para o calculo de n 
sao derivadas, fixando o erro maximo, e e o nivel de confianga (1 — a). A determinagao de 
n tambem depende do piano amostral adotado e do parametro a ser estimado. 

No caso da amostragem aleatoria simples, a formula de n para a estimagao de pi e 
encontrada isolando n em 


e = 


cr 



Portanto 
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em que c deve ser previamente estimado e z e obtido conforme o nfvel de confianga. 
SugestSes para estimagao previa de cr: 

1. usar estimativas de o, de um estudo similar feito anteriormente ou de uma amostra 
piloto; 

2. Em muitas situagSes, podemos considerar que a ~ am P^ tudc . q argumento teorico 
para o uso desta aproximagao esta baseado na propriedade da distribuigao Normal 
com media p. e desvio-padrao a, de que a area entre p — 2cr e p + 2cr e igual a 95,5%; 
portanto esta aproximagao nao deve ser usada se a variavel em estudo for muito 
assimetrica. 


Exemplo 4.7. Qual e o tamanho de amostra necessario para estimar a renda media 
mensal das faimlias de uma pequena comunidade, com um erro maximo de 100 reais com 
95% de confianga, usando amostragem aleatoria simples? Sabe-se que a renda mensal 
familiar esta entre 50 e 1000 reais. 

Temos que e = 100 e para um nfvel de confianga igual a 95%, z = 1,96. Com a 
informagao de que a renda varia entre 50 e 1000, uma aproximagao para a e: 


amplitude 1000 — 50 

— = 237, 5 

4 4 


Assim, 



/ 1, 96 • 237,5 

V 100 


2 


21,67 « 22. 


Portanto, cerca de 22 faimlias devern ser entrevistadas. 


Para a estimagao de p, a formula para determinar n, usando amostragem aleatoria 
simples, e encontrada isolando n em 


e= RES, 

V n 

Portanto, 


em que p deve ser previamente estimado e z e obtido conforme o nfvel de confianga. 
SugestSes para estimagao previa de p: 


1. Usar estimativas de p de um estudo similar feito anteriormente ou de uma amostra 
piloto; 

2. Substituir o produto p{ 1 — p) por 0,25. Notamos que ao substituir por 0,25, o 
tamanho da amostra pode ser maior que o necessario. E por isso que chamamos de 
abordagem conservadora, quando fazemos esta substituigao nas formulas do intervalo 
de confianga. 
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Exemplo 4.8. Lideres estudantis de uma faculdade querem conduzir uma pesquisa para 
determinar a proporgao p de estudantes a favor de uma mudanga no horario de aulas. 
Como e impossivel entrevistar todos os 2000 estudantes ern urn tempo razoavel, decide-se 
fazer uma amostragem aleatoria simples dos estudantes: 


a) Determinar o tamanho de amostra (numero de estudantes a serern entrevistados) 
necessario para estimar p com um erro maximo de 0,05 e nivel de confianga de 95%. 
Assumir que nao ha nenhuma informagao a priori disponivel para estimar p. 


Temos que e 
que 


0, 05 e que z = 1, 96. Como nao ha informagao a priori sobre p, segue 


n = z 


2 P{1~P) 


1, 96" 


0,25 
0, 05 2 


384, 16 « 385. 


Para estimar o proporgao de estudantes favoraveis a mudanga de horario, com um 
erro maximo de 0,05 a 95% de confianga, e necessaria uma amostra de 385 estudantes. 


b) 


Os lideres estudantis tarnbem querem estimar a proporgao de p de estudantes que 
sentem que a representagao estudantil atende adequadamente as suas necessidades. 
Com um erro maximo de 7% e nivel de confianga de 95%, determinar o tamanho de 
amostra para estimar p. Utilizar a informagao de uma pesquisa similar conduzida a 
alguns anos, quando 60% dos estudantes acreditavam que estavam bem representa- 
dos. 


2 p(l -p) 2 0,60(1 - 0,60) 

e 2 ’ 0, 07 2 


188, 16 w 189. 


Para estimar o proporgao de estudantes que se consider am bem representados, e 
necessaria uma amostra de 189 estudantes; considerando um erro maximo de 0,07 a 
95% de confianga. 


c) Qual o tamanho de amostra adequado para atingir arnbos os objetivos da pesquisa? 

Para atingir arnbos os objetivos da pesquisa, devemos considerar a rnaior amostra, 
que e a de 385 estudantes. 


Quando N (tamanho da populagao) e conhecido, o valor de n para estimar pep 
pode ser corrigido (n*): 

* Nn 

U = T7 • 

N + n 

Notamos que se N e muito maior que n, entao n* e aproximadamente n. 


Exemplo 4.9. Determinar o tamanho de amostra necessario para estimar o volume medio 
de vendas de carros novos nacionais entre as concessionarias, fixando um nivel de confianga 
de 99% para um erro de estimagao igual a 1 automovel. E conhecido que existem 200 
concessionarias na regiao em estudo. Em uma pesquisa similar feita 5 anos antes, o 
desvio-padrao amostral foi igual a 2,8. Supor que foi feita uma amostragem aleatoria 
simples. 
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Temos que e = 1 e para um mvel de confianga igual a 99% ternos que z = 2, 58. 
Usaremos a estimativa a priori para o , substituindo-o na formula por 2,8. Assirn, 


n = 



^ 2,58 • 2,8 


2 

= 52,19 


53. 


Com a informagao de que ha N = 200, podemos corrigir o valor de n 


Nn 200 • 53 
N + n ~ 200 + 53 


10600 

253 


41,90 « 42. 


Portanto, e necessario selecionar 42 concessionarias de automoveis, para estimar o numero 
medio de carros vendidos, com um erro maximo de 1 automovel a 99% de confianga. 


Capitulo 5 


Testes de Hipoteses 


5.1 Introducao 

Os testes estati'sticos sao regras de decisoes, vinculadas a um fenomeno da populagao, 
que nos possibilitam avaliar, com o auxflio de uma amostra, se determinadas hipoteses 
(suposigoes, conjecturas, algo qualquer que um pesquisador esteja estabelecendo) podem 
ser rejeitadas, ou nao. 

No campo da Inferencia Estatfstica, a busca por respostas acerca de certas carac- 
terfsticas de uma populagao estudada e de fundamental importancia. Apenas com base 
nessas caracterfsticas e que se devem estabelecer regras e tornar decisoes sobre qualquer 
hipotese formulada no que se refere a populagao. Dessa forma, escolhida uma variavel 
X e colhida uma amostra aleatoria da populagao, podemos estar interessados em inferir 
a respeito de alguns de seus parametros (media, variancia e proporgao, por exemplo) e, 
tambem, sobre o comportamento da variavel (a sua distribuigao de probabilidade). A rea- 
lizagao de testes de hipoteses nos fornece meios para que possamos, com determinado grau 
de certeza, concluir se os valores dos parametros ou mesmo a distribuigao associados a 
populagao considerada, podem representa-la de forma satisfatoria. Nesse contexto, temos 
os Testes Parametricos, vinculados a estimagao dos valores dos parametros e os Testes de 
Aderencia, associados a busca da distribuigao de X. Na verdade, corno veremos nos exem- 
plos do item 5.3, quando realizamos Testes Parametricos, esses estao intimamente ligados 
aos Testes de Aderencia. Pois, para se obter a “determinada certeza” citada, e necessario 
que saibamos qual a distribuigao de probabilidade que melhor se ajusta as estimativas 
observadas por intermedio das amostras. 

A maior parte das ciencias se utiliza da tecnica Estatfstica denominada Teste de 
Hipoteses. Podemos citar algumas suposigoes: o dado de certo cassino e honesto; a 
propaganda de um produto vinculada na televisao surtiu o efeito desejado; uma ragao 
desenvolvida para certo animal proporcionou um ganho maior de peso do que aquela ja 
utilizada ha anos; vale a pena trocar as maquinas desta industria; qual medicamento e 
mais eficaz no tratamento de certa doenga; a metodologia empregada na educagao infantil 
esta associada ao aprendizado; o candidate A esta com uma intengao de votos superior ao 
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seu adversario; o nunrero de acidentes por dia na BR-116 segue uma distribuigao de Pois- 
son; o tempo de vida de uma marca de lampada pode ser representado pela distribuigao 
Exponential. E assim, podeiiamos citar inumeras suposigoes dentro de todas as areas do 
conhecimento. Vejamos, agora, algumas terminologias e conceitos adotados na area dos 
Testes de Hipoteses Parametricos. 


5.2 Conceitos Estatisticos dos Testes de Hipoteses 

5.2.1 Hipoteses estatisticas parametricas 

As hipoteses parametricas sao suposigoes sobre os valores dos parametros de certa 
populagao. 


Tipos de hipoteses 

1. Hipotese de Nulidade (Nula): e a hipotese que esta sendo testada. Colhida uma 
amostra a fim de inferirmos a respeito do valor parametrico (9), obtemos a estimativa 
do parametro ( 6 ) por intermedio de uma Estimador. Dai, por meio do Calculo 
de Probabilidades, cujos resultados sao obtidos em fungao da Hipotese Nula (Ho), 
tomamos a decisao de rejeitar, ou nao, Ho. Nessa decisao, e verificada se a diferenga 
observada entre o valor suposto na Hipotese Nula e a estimativa do parametro, 6—6, e 
significativa, ou nao. Veja que quanto menor a diferenga, maior sera a probabilidade 
de nao rejeitarmos Hq. Assim, dizemos que (6 — 6) nao foi significativa, concluindo-se 
que tal diferenga ocorreu por acaso. Caso contrario, devemos rejeitar Ho e concluir 
que a diferenga foi suficientemente grande para nao ter, provavelmente, ocorrido ao 
acaso. Vejamos o exemplo: Sera que a altura media (6 = p) dos alunos da UFPR e 
de 1,71 m? Resumidamente, a Hipotese Nula poderia ser descrita desta forma: 


Ho : p = 1, 71 m 


Para respondermos a essa questao, deveriamos colher uma amostra de tamanho n e 
obtermos a estimativa da media (6 = X 0 b s ), fungao da amostra, e, posteriormente 
verificarmos a diferenga entre p e x 0 b s . Caso Hq fosse rejeitada, concluiriamos que 
a diferenga observada foi significativa e que nao se deveu ao acaso. Logo, a media 
verdadeira (p) assume um outro valor, desde que diferente de 1,71 m. E, conseqiien- 
temente, esses possiveis valores pertenceriam a Hipotese Alternativa. 

2. Hipotese Alternativa (H a ou H\): e uma hipotese que, necessariamente, difere de 
Hq. Assim, nesse contexto, teriamos: Hi : p / 1, 71 nr ou H\ : p < 1,71 nr ou 
Hi : p > 1, 71 nr. 
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5.2.2 Testes 

Sao regras de decisao acerca da rejeigao ou nao rejeigao de uma determinada Hipotese 

Nula. 

Tipos de testes 

Dependendo do interesse da pesquisa, podemos estabelecer testes especi'ficos con- 
forme o objetivo do pesquisador. Por exemplo: 

1. Teste Bilateral (Bicaudal): Hq : p = 1, 71 m vs H\ : p ^ 1, 71 m. 

Note que o objetivo desse teste e decidir se a media populacional nao difere de 
1, 71 m, nao importando se p sera maior ou menor do que 1,71 nr. 

2. Teste Unilateral a Direita: Hq : p = 0, 30 vs H\ : p > 0, 30. 

Esse teste tern por finalidade verificar se, por exemplo, a proporgao verdadeira nao 
so difere de 0,30, mas, tambern, necessarianrente, se p e maior do que 0,30. Ob- 
jetivanrente, poderiamos citar uma pesquisa que visa verificar se um deternrinado 
candidato a Reitor, conseguiu aumentar sua intengao de votos apos a realizagao de 
um debate com seu adversario realizado pela televisao. 

3. Teste Unilateral a Esquerda Hq : o 2 = 5 vs H\ : a 2 < 5. 

Nesse contexto, visamos estabelecer uma Regra de Decisao para verificarmos se a 
variabilidade e menor do que 5. Pois, por exemplo, se for menor do que 5, nao seria 
recomendado investirmos num mellroramento genetico. 

5.2.3 Tipos de erros cometidos ao se tomar uma decisao 

Ao trabalharmos com amostras para tomarnros decisoes, e bem provavel incorrer 
enr erros. A esses erros chamanros de Erro Tipo I (de 1“ Especie) e Erro Tipo II (de 2“ 
Especie). E as probabilidades associadas a eles denotarenros por a e /3, respectivamente. 
A Tabela 5.1 ilustra tais ideias: 


Tabela 5.1: Erros cometidos na tomada de decisao. 



Realidade 

Decisao 

Hq e Verdadeira 

Hq e Falsa 

Rejeitar Hq 

Erro Tipo I 

Decisao Correta 

Nao Rejeitar Hq 

Decisao Correta 

Erro tipo II 


Portanto, as probabilidades ficariam: 

a = P( Rejeitar Hq\Hq e Verdadeira) e /3 = P(Nao Rejeitar i^ol^o e Falsa). Na 
realizagao de um Teste de Hipoteses levamos em consider agao essas duas probabilidades. 
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Caso utilizarmos apenas a, como e usual, estariamos realizando um Teste de Significancia. 

0 valor de fd esta associado ao poder do teste. Pois, a Fungao Poder do teste e dada por 

1 — fd(p*). Sendo p* o valor verdadeiro, porern, desconhecido da media populacional. 

Espera-se que quanto rnenor o valor de fd, rnaior poder tera o teste. Se realizarmos 
um Teste de Hipoteses, esse valor devera ser considerado na analise. Pois, como fd = P(Nao 
Rejeitar Hq\Hq e Falsa), (3 dependeria do valor da media verdadeira para sua obtengao, 
visto que o calculo dessa probabilidade esta condicionada a Hq ser falsa. Portanto, teriamos 
de obter tal probabilidade para valores de p diferentes de 1,71 m. Detalhes desse calculo 
serao vistos no Exemplo 5.2 do 5.3. 

5.2.4 Regiao critica (RC) e regra de decisao (RD) 

Quando efetuamos um Teste de Hipoteses (ou de Significancia), a probabilidade a, 
tambem denotada por nivel de significancia, estara intimamente ligada a Regra de Decisao 
do Teste. Logo, ao estabelecermos a, podemos construir uma regiao onde devemos rejeitar 
Ho- Portanto, sob Ho, essa regiao, chamada de Regiao Critica (ou de Regiao de Rejeigao), 
devera conter todas as possfveis amostras raras de ocorrerem. Dessa forma, escolhido um 
a = 0,01, dizemos que qualquer amostra cuja probabilidade de ocorrencia for menor do 
que 0,01, nos levara a decisao de rejeitar Ho- Pois, sob a referenda adotada (a), tal amostra 
sera considerada rara (probabilidade< 0,01) se admitirmos Hq como verdadeira. Devemos 
notar, entao, que existem amostras que podem ser coletadas, de certa populagao, que 
nos fornecem resultados bem diferentes dos esperados (sob Ho), que pertencem a Regiao 
Critica, porern, com probabilidades bastante baixas a ponto de concluirmos que se tratam 
de amostras raras. Dai, a conclusao mais plausivel e a de rejeitarmos a Hipotese Nula. 
Note, ainda, que se Hq fosse falsa, a probabilidade dessas amostras ocorrerem poderia ser 
alta. Esse conceito sera tratado, detalhadamente, na discussao da Tabela 5.6. 

Tomando-se novamente o exemplo da altura media dos alunos da UFPR, criariamos 
uma Regra de Decisao com base em a = 0, 01 e H\ : p < 1, 71 m. Assim, poderiamos 
estabelecer a seguinte regra: Caso coletarmos uma amostra cujo resultado ( x Q bs ) for menor 
do que 1, 67 m, decidiremos por rejeitar Ho, pois a probabilidade disso ocorrer e menor do 
que a = 0, 014. Ou seja, sob a referenda (a = 0, 01), a amostra coletada devera ser vista 
como rara se a Hipotese Nula for verdadeira (Ho : p = 1,71). Conseqiientemente, seria 
mais conveniente optarmos em dizer que g < 1,71 m. 

Nesse contexto, vejamos no item 5.2.5 algumas etapas de um Teste de Significancia. 

5.2.5 Procedimentos para realizagao de um teste de significancia 

1. Estabelecer as Hipoteses Nula e Alternativa; 

2. Identificar a Distribuigao Amostral associada ao Estimador e obter a Estimativa do 

Parametro; 
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3. Fixar um valor para o Nivel de Significancia (a) e obter a estatfstica de teste do 
Parametro por meio da Estatfstica do Teste; 

4. Construir a Regiao Crftica (RC) com base na Hipotese Alternativa e no valor de a 
e estabelecer a Regra de Decisao (RD); 

5. Concluir o Teste: Se a Estimativa do Parametro pertencer a Regiao Crftica, rejeita- 
mos a Hipotese Nula. Caso contrario, nao. 

Com a finalidade de ilustramos tais conceitos, vejamos algnns exemplos. 

5.3 Exemplos 

Serao vistos dois exemplos com a finalidade de explicar, detalhadamente, as ideias 
sobre os Testes de Hipoteses. Sao eles: 

Exemplo 5.1. Imagine que seu amigo Jose lhe diga o seguinte: Possuo ern meu bolso do 
paleto 16 bolas de gude, sendo que 10 sao brancas (B), 4 sao verdes (V) e 2 sao amarelas 
(A). Voce acreditaria nessa afirmagao? Quais seriam os meios que voce disporia para 
verificar a verdade? Fornralmente, poderfamos estabelecer, primeiramente, as seguintes 
hipoteses: Ho: Jose nao esta mentindo versus H\: Jose esta mentindo, bem como fixar 
um valor para a, por exemplo 0,10. E, posteriormente, criar algumas alternativas para 
uma tomada de decisao. A primeira delas seria, simplesmente, esvaziar o bolso do Jose e, 
conseqiientemente, tomar uma decisao. Como, nessa situagao, forarn observadas todas as 
bolas, a sua decisao sera absolutamente correta. Ou seja, nao restara duvida (incerteza) 
ern relagao a afirmagao de Jose, caso decidfssemos rejeitar Ho- Porern, em Estatfstica, nem 
sernpre isso e possfvel, ou por inacessibilidade de toda populagao, ou pela inrpossibilidade 
desse procedimento ou, ainda, por tal procedimento ser inviavel, ou seja, nao possuir 
um sentido pratico. Como exemplo, podemos citar a verificagao do tempo de vida de 
certa rnarca de lampada. Obviamente, nao faria o menor sentido amostrarmos todas as 
lampadas de uma linha de produgao, pois assim nao restaria nenhuma delas para a venda. 
E o resultado desse procedimento seria desastroso. 

Nesse contexto, uma segunda alternativa nos levaria a coleta de uma amostra de 
tamanho n e observarfamos o resultado e, assim, tomarfamos uma decisao. Portanto, voce 
poderia, por exemplo, retirar 2 bolas (n = 2) do bolso do Jose, sem reposigao. Imaginemos, 
conforme a Tabela 5.2, algumas ocorrencias, inrplicagoes e possfveis decisoes: 


Tabela 5.2: Algumas ocorrencias, implicagoes e decisoes apos a retirada da amostra. 



Ocorrencia 

Implicagao 

Decisao 

I 

1 Bola Branca e 1 Bola Preta 

Afirmagao Falsa 

Jose mentiu 

II 

2 Bolas Brancas 

Afirmagao Possfvel 

Jose, provavelmente, nao mentiu 

III 

2 Bolas Amarelas 

Afirmagao Possfvel 

Jose, provavelmente, mentiu 
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Note que, a ocorrencia I e impossivel, pois nao existem bolas pretas. Porem, e 
imprescindivel que notemos que a ocorrencia I so se torna inconsistente se a afirmagao de 
Jose for verdadeira. Afirmagao essa, que transformamos em hipotese estatistica {Hq: Jose 
nao esta mentindo) a fim de criar uma referenda para a tomada de decisdes. Note, entao, 
que a ocorrencia I, na verdade, e possi'vel, tanto e que ela ocorreu. Mas, a probabilidade 
dela ter ocorrido dado que Hq e verdadeira, e igual a zero. Dai, a opgao em rejeitar a 
hipotese. Jose certamente mentiu. Veja, tambem, que o fato de ter ocorrido I, implica em 
varias outras possibilidades de ocorrencia caso fossem coletadas outras amostras (n=2). 
Mas, isso nao nos importaria mais, visto que a decisao ja foi tomada com uma certeza 
absoluta. 

Analisemos, agora, as ocorrencias II e III: 

Nunca perca de vista que, tanto a ocorrencia II quanto a ocorrencia III so se tornam 
possiveis sob a afirmagao de Jose (sob Hq). Ou seja, se Jose afirma que existem 10 bolas 
brancas e 2 amarelas, e claramente viavel que se retirem 2 bolas brancas ou 2 amarelas 
dentre as 16. Agora, a diferenga fundamental para a ocorrencia I e que nessas outras 
ocorrencias a tomada de decisao, sobre a honestidade de Jose, vem carregada de urn grau 
de incerteza. Portanto, admitindo-se que cada bola possui a mesma probabilidade de 
pertencer a amostra, podemos, entao, obter as probabilidades de ocorrencia para todos os 
possiveis eventos associados a todas as amostras de tamanho 2. Com base nesse calculo de 
probabilidades verificamos se a hipotese testada {Hq) deve, ou nao, ser rejeitada. Como 
podemos ver na Tabela 5.3, as probabilidades, sob a hipotese de que a afirmagao de Jose 
e verdadeira, ficariam: 


Tabela 5.3: Distribuigao de probabilidac 


es das possiveis amostras. 


Amostra 

AA 

VV 

AV 

AB 

BV 

BB 

Probabilidade 

1/120* 

6/120 

8/120 

20/120 

40/120 

45/120 


* P{AA) = (fl 


1 

120 


Observe que sob a alegagao de Jose, todas essas amostras sao possiveis e cada uma 
delas possui uma determinada chance de ocorrer. Dai, caso ocorra a amostra BB, seria 
plausivel admitirmos que Jose esteja falando a verdade. Pois, a probabilidade associada 
ao evento BB sob a hipotese de que Jose nao esteja mentindo e alta (0,375). Ou seja, se 
refizessemos o experimento 100 vezes, esperariamos que em quase 38 vezes ocorressem 2 
bolas brancas. Alem disso, comparativamente com o nivel de significancia adotado (a) 
esperariamos que as amostras raras ocorressem com freqiiencias inferiores ou iguais a 10 
em 100. Logo, a amostra BB nao poderia ser considerada rara. Portanto, por conveniencia, 
com base no calculo de probabilidades, e melhor que nao rejeitemos a afirmagao. Assim, 
Hq nao deve ser rejeitada e a ocorrencia de BB deve ter sido por acaso. Agora, se ocorrer 
a amostra AA, a decisao deve ser oposta. Pois, a probabilidade desse evento ocorrer e 45 
vezes menor do que a anterior (0,0083). Assim, se o experimento fosse refeito 120 vezes, 
em apenas 1 vez esperariamos uma amostra do tipo AA. Freqiiencia essa bem abaixo da 
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referenda adotada de 10 ern 100. Conseqlientemente, conclufmos que a amostra AA e 
rara. O que nos induz a pensar que, provavelmente, o Jose estaria mentindo. 

Note que tivemos de tomar uma decisao com base na distribuigao de probabilidades 
das possfveis amostras. Dessa forma, deverfamos ter pensado o seguinte: Se admitirmos 
que Jose disse a verdade, o que seria mais facil de ocorrer quando retiramos a amostra AA? 
O Jose estar mentindo ou, de fato, termos realmente colhido tal amostra rara? Veja que 
nao se trata de amizade e sim de possibilidades. Tome sua decisao como base naquilo que 
foi amostrado, no que realmente aconteceu, baseando-se na distribuigao de probabilidades 
das possfveis amostras. Dessa forma, a Regra de Decisao adotada deve ser a seguinte: 
Se coletarmos uma amostra e sua probabilidade de ocorrencia for menor do que 0,10, 
concluiremos que se trata de amostra rara e assim devemos rejeitar Ho- Caso contrario, 
nao. Veja um resumo dessa ideia na Tabela 5.4. 

No momento em que tomamos a decisao de nao rejeitar a Hipotese Nula quando 
retiramos a amostra BB, e evidente que podemos estar incorretos nessa decisao, uma vez 
que ha outras probabilidades envoi vidas. E todas elas menores do que 1. A esse tipo de 
erro, como ja discutido, chamamos de Erro Tipo II. Assim, imagine que Jose estivesse a 
fim de que tomassemos uma decisao incorreta. Ele, sabendo desses conceitos, poderia ter 
colocado em seu bolso apenas bolas brancas. Dessa forma, ele saberia a priori que voce 
so poderia coletar 2 bolas brancas e, conseqlientemente, tomar a decisao errada. 

Outra tomada de decisao incorreta seria voce rejeitar a hipotese quando ela e verda- 
deira. Assim voce diria que seu amigo mentiu, quando, na realidade, ele disse a verdade. 
Esse erro e denotado por Erro Tipo I, que para esse exemplo estabelecemos sua probabi- 
lidade em 0,10. 

A Tabela 5.4 resume as decisbes adotadas em fungao de todas as possfveis amostras. 


Tabela 5.4: Resumo das decisbes para o Exemplo 5.1. 



Decisao 

Amostra 

a = 0, 10 

a = 0, 05 

a = 0, 01 

AA 

Rejeitar Hq 

Rejeitar 77 o 

Rejeitar Ho 

AB 

Nao Rejeitar Ho 

Nao Rejeitar Ho 

Nao Rejeitar Ho 

AV 

Rejeitar Hq 

Nao Rejeitar Hq 

Nao Rejeitar Ho 

BB 

Nao Rejeitar Hq 

Nao Rejeitar Ho 

Nao Rejeitar Ho 

BV 

Nao Rejeitar Ho 

Nao Rejeitar Ho 

Nao Rejeitar Ho 

VV 

Rejeitar Hq 

Rejeitar 77 q 

Nao Rejeitar Ho 


Pela analise da Tabela 5.4 podemos tirar algumas conclusoes: 

1. A rnedida que diminufmos o Nfvel de Significancia do Teste, torna-se mais diffcil 
rejeitar a Hipotese Nula. E obvio que isso ocorra, pois com a menor, a amostra 
coletada tera uma chance cada vez menor de ser considerada rara; 
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2. Optamos por rejeitar Hq para a ocorrencia de VV com a = 0, 05. Porem, segundo a 
Tabela 3, a probabilidade de retiramos essa amostra e igual a a. Valor esse que se 
encontra exatamente no limite de nossa Regra de Decisao. Entao, intuitivamente, o 
que deverfamos fazer? 

Naturalmente, a solugao seria repetirmos o experimento k vezes, ou seja, em vez de 
apenas uma amostra, deverfamos collier k amostras. Assim, a fim de tomarmos decisoes 
mais acertadas obterfamos uma nova Distribuigao Amostral com uma gama bem maior de 
eventos possfveis, aumentando o poder do Teste, tornando-o melhor. Caso coletassemos 
outra amostra (n = 2), ou seja, se refizessemos o experimento, terfamos 21 resultados 
possfveis (21 novas amostras) com suas respectivas probabilidades associadas. Veja alguns 
resultados e decisoes desse novo experimento na Tabela 5.5. 



Abela 5.5: Resumo das decisoes para o novo experimento. 



Decisao 

Amostra 

Probabilidade 

a = 0, 10 

a = 0,05 

a = 0, 01 

(AA,AA) 

1/14400 

Rejeitar H 0 

Rejeitar H 0 

Rejeitar H 0 

(AA,AB) 

40/14400 

Rejeitar H 0 

Rejeitar H 0 

Rejeitar H 0 

(AA.AV) 

16/14400 

Rejeitar H 0 

Rejeitar H 0 

Rejeitar H 0 






(BB,AB) 

1800/14400 

Nao Rejeitar H 0 

Nao Rejeitar H 0 

Nao Rejeitar H 0 

(BB,AV) 

720/14400 

Rejeitar H 0 

Rejeitar H 0 

Nao Rejeitar H 0 

(BB,BB) 

2025/14400 

Nao Rejeitar H 0 

Nao Rejeitar H 0 

Nao Rejeitar H 0 

(BB,BV) 

3600/14400 

Nao Rejeitar H 0 

Nao Rejeitar H 0 

Nao Rejeitar H 0 






(VV,VV) 

36/14400 

Rejeitar H 0 

Rejeitar H 0 

Rejeitar H 0 

(AV,BV) 

640/14400 

Rejeitar H 0 

Rejeitar H 0 

Nao Rejeitar H 0 

(BV,BV) 

1600/14400 

Nao Rejeitar H Q 

Nao Rejeitar H 0 

Nao Rejeitar H 0 


Observe na Tabela 5.5 que se a amostra A A ja era considerada rara, a amostra 
(AA, AA) se tornou ainda mais. Pois, se refizessemos o experimento 14400, esperarfamos 
em apenas 1 vez coletar simultaneamente a amostra AA. Por conseqiiencia, a decisao em 
rejeitar Hq e muito mais segura do que a anterior. Alem disso, o valor de (3 = P(Nao 
Rejeitar Hq\Hq e Falsa) se torna cada vez menor. Lembre-se que decidimos modificar 
o experimento porque a realizagao de VV nos forneceu uma inseguranga na tornada de 
decisao. Agora, com o experimento modificado, a coleta da amostra (VV, VV) possui 
uma probabilidade muito pequena (0,0025), indicando, nesse caso, ser uma amostra rara. 
Daf, a decisao deixa de ser insegura. 

Nesse contexto, com base em seus conhecimentos de Calculo de Probabilidades e 
Distribuigdes Amostrais, complete a Tabela 5.5 e, tambern, construa uma outra tabela 
similar a Tabela 5.5 refazendo o experimento do Exemplo 5.1 tres vezes retirando amostras 
de tamanho 2, em cada uma das vezes, sem reposigao. 
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Finalmente, e essencial que notemos que, dependendo da forma como se realiza o 
experimento, a distribuigao de probabilidades das possfveis amostras, sempre utilizada com 
intuito de se tomar uma decisao em relagao a Hipotese Nula, se modifica substancialmente. 
Assim, no experimento inicial, com a retirada de apenas uma amostra (n=2), a amostra 
BB possui'a, como ja era esperado, a maior probabilidade (0,375) uma vez que tmhamos 10 
bolas brancas. Ja no experimento modificado com a retirada de duas amostras de tamanho 
2, a probabilidade associada a amostra (BB, BB), mesrno possuindo ainda as mesmas 10 
bolas brancas, diminui consideravelmente (0,14). Assim, se modificarmos ainda mais o 
experimento inicial, repetindo-o, por exemplo quatro vezes, a probabilidade observada de 
(BB, BB, BB, BB) ficaria aproximadamente em 0,0198. Portanto, rejeitariamos Hq para 
niveis de significancia maiores do que 0,0198. Conseqiientemente, mudariamos nossas 
decisoes em relagao aos experimentos anteriores. 

Exemplo 5.2. Antes de enunciarmos este exemplo, gostariamos de refletir sobre a seguinte 
pergunta: O valor 167 cm e menor do que 171 cm? Obviamente que muitos, talvez a 
maioria, diriam que sim. Porem, antes que saibamos como esses resultados foram obtidos, 
a melhor resposta seria: depende. Vejamos, entao, as reflexoes 1 e 2: 

1. Se medissemos as alturas de duas pessoas A e B, da mesma maneira e obtivessemos, 
respectivamente, 167 cm e 171 cm. Concluiriamos que A e, de fato, menor do que 
B; 

2. Se o interesse for descobrir e comparar a altura media de duas turmas (A e B) 
da UFPR, poderfamos obter essas alturas medias de varias maneiras, vejamos dois 
casos: 

(a) com a coleta das duas populagbes, as medias obtidas seriam as medias verda- 
deiras, ou seja, os valores parametricos (pa e ps)- Assim, dirfamos novamente 
que 167 cm e menor do que 171 cm. 

(b) coletando-se a populagao de A e uma amostra de B, e obtidas as medias 
PA = 167 cm e xb = 171 cm, nao poderiamos afirmar com absoluta certeza 
que 167 cm e menor do 171 cm. Pois, recordando o conceito de Distribuigao 
Amostral, sabemos que X e uma variavel aleatoria. Portanto, a P(X G RC ) e 
dependente de uma Distribuigao de Probabilidade, conseqiientemente, apenas 
com base no comportamento dele que poderiamos decidir se, provavelmente, 
PA < Pb • Assim, se tanto na turma A quanto na B, ou nas duas forem co- 
letadas amostras, a resposta para a questao proposta sempre dependera do 
comportamento das estimativas das possiveis amostras. Comportamento esse, 
representado por rneio de uma Distribuigao de Probabilidades e, portanto, toda 
decisao a respeito da questao vira acompanhada de um grau de incerteza. A 
Inferencia Estatistica, por intermedio do Teste de Hipoteses, visa responder a 
essa questao. 
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Feitas as reflexdes, podemos enunciar o Exemplo 5.2: Sabemos que a variavel (X) 
altura dos alunos da Universidade A, local A, segue uma distribuigao normal com altura 
media de 171 cm e desvio padrao de 9 cm. Se recebermos, de uma origem desconhecida, 
local B, uma amostra de 27 alunos, poderiamos decidir se essa amostra foi retirada da 
Universidade A ou se o local B possui a mesma media do local A? 

Admitamos que a populagao cuja amostra (n=27) foi retirada seja bem representada 
por uma distribuigao normal com desvio padrao igual ao da Universidade A (cr = 9cm). 
Sabemos da Teoria da Estimagao que se Xa ~ 1V(171,9 2 ), entao, Xa ~ N( 171, 9 2 /27). 
Assim, o comportamento das estimativas das rnedias das possfveis amostras da Univer- 
sidade A fica bem caracterizada: Xa ~ 1V(171,3). Supondo que xb = 167 cm, essa 
estimativa pode ser vista como rara ou nao? Como poderiamos, com base na estimativa 
da media da amostra B, obter uma Regra de Decisao para concluirmos sobre a origem 
dessa amostra. Enfim, qual conclusao deveriamos tomar? A solugao e simples. Assim 
como no Exemplo 5.1, basta verificar se seria plausivel coletarmos do Local A uma amos- 
tra de 27 alunos cuja estimativa da altura media fosse de 167 cm. Porem, diferentemente 
do Exemplo 5.1, a variavel X desse exemplo e continua. Portanto, sendo a probabilidade 
pontual igual a zero, devemos obter uma probabilidade intervalar. Assim, poderiamos 
calcular a probabilidade da estimativa da media ser menor ou igual a 167 cm sob Hq, ou 
seja, supondo que p = 171 cm, P(xb < 167|// = 171). Assim, estariamos contemplando 
no calculo dessa probabilidade valores iguais a 167 cm, mas, tambem, valores com rnedias 
inferiores a 167 cm. Dessa forma, comparando-se com a Regra de Decisao adotada, pode- 
mos concluir se essas estimativas sao raras. Com o auxilio da transformagao da variavel 
X na Normal Padronizada, Z N{ 0, 1), calculariamos a probabilidade dessa forma: 

P{x B < 167 | p = 171) = 


Graficamente, terfamos (Figura 5.1): 

Com base nessa probabilidade, chamada de Nivel Descritivo (P-valor) do Teste, 
podemos tomar uma decisao da seguinte forma: se acharmos que essa probabilidade e 
baixa, concluirfamos que: 

• a amostra deve ser rara; 

• deveriamos rejeitar a Hipotese Nula de que os 27 alunos pertencem a Universidade 

A; 

• pa deve ser superior a ps\ 

• a diferenga observada (pa — xb) =4 cm, provavelmente, foi significativa; 


P 


P 


Z < 


Z < 


X- p 


cr/y/n 
167-171 


9/-\/27 
P(Z < -2,31) = 0,0105. 
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Figura 5.1: Area hachurada relativa ao P- Valor do teste 


• a diferenga observada nao deve ter ocorrido por acaso; 

• se refizessemos o experimento inumeras vezes, esperarfamos que na maioria delas as 
estimativas vindas das possiveis amostras (n=27) do local B, nos fornecesse valores 
inferiores a 171cm, indicando, portanto, uma tendencia. 

Formalmente, poderiamos realizar o teste segundo as etapas do item 5.2.5. Assim, 

1. Estabelecer as Hipoteses Nula e Alternativa; 

f Hq : p = 171 cm 
| H\ : p < 171 cm 

2. Identificar a Distribuigao Amostral associada ao Estimador e obter a Estimativa do 
Parametro; 

Xa ~ 1V(171,3) e xb = 167 cm 

3. Fixar um valor para o Nivel de Significancia (a) e obter a estatlstica de teste do 
Parametro; 


a = 0, 05 


® ^ co.lculado = s [— 

cr/ y/n 


-2,31 
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4. Construir a Regiao Critica com base na Hipotese Alternativa e no valor de a; 

z teorico ~ ~ 1)6449 ou x cr {f/ lco — 168,2 cm 

Regra de decisao: Se a Estimativa do Parametro pertencer a Regiao Critica, rejei- 
tarnos a Hipotese Nula. Caso contrario, nao. Ou seja, se z ca i cu i a do < ^teorico’ ou se 
xb < M 168,2, rejeitamos Hq. 

5. Conclusao: Como Z ca i cu i a d 0 = —2,31 < ^Teorico = — 1,6449 ou xb = 167 cm < 
168,2 cm. Decidimos por rejeitar Hq. 

A obtengao do P-valor, essencial para a tomada de decisao, esta intimamente ligado 
ao comportamento da distribuigao das estimativas obtidas com o auxflio das possfveis 
amostras coletadas da populagao. Esse comportamento pode ser descrito pela fungao de 
densidade de probabilidade (f.d.p) associada a distribuigao amostral dessas estimativas. 
Porern, essa f.d.p. so podera ser perfeitamente caracterizada sob a referenda da Hipotese 
Nula. Entao, os valores parametricos que a caracterizam estao contidos ern Hq. Dessa 
forma, dependendo dos valores parametricos supostos em Hq, obteremos P-valores distintos 
e, em conseqiiencia, poderemos tomar decisbes diferentes. Para ilustrar tal fato, tomemos 
o Exemplo 5.2 corno referenda e imaginemos algumas situagbes em que a, pq e n sao 
modificados. As Decisoes e as Regras de Decisao, em fungao de x 0 f, s = 167, podem ser 
vistas na Tabela 5.6: 

Tabela 5.6: Algumas tomadas de decisao e regras de decisao conforme a hipotese nula, o 
nfvel de significancia e a distribuigao de probabilidade. 





Decisao(x 0 f, s = 167) 

Regra de decisao para rejeitar Hq 

Situagao 

P-valor 

o: = 0, 01 

o = 0, 05 

o = 0, 10 

a = 0, 01 

a = 0, 05 

o = 0, 10 

Exemplo 5.2 
O = 171; a = 9) 

0,0105 

NR 

R 

R 

Se X < 166, 97 

Se X < 168, 2 

Se X < 168, 8 

I 

A l = 170 
£7 = 9 

0,0416 

NR 

R 

R 

Se X < 166 

Se X < 167, 2 

Se X < 167, 8 

II 

H = 170 
£7 = 10 

0,06 

NR 

NR 

R 

Se X < 165, 5 

Se X < 166, 8 

Se X < 167, 5 

III 

fj. = 170 

£7 = 6 

0,0047 

R 

R 

R 

Se X < 168, 7 

Se X < 169, 1 

Se X < 169, 3 

IV 

fJy = 168 
£7 = 2 

0,0047 

R 

R 

R 

Se X < 167, 1 

Se X < 167, 4 

Se X < 167, 5 

V 

H = 173 

£7 = 12 

0,0047 

R 

R 

R 

Se X < 167, 6 

Se X < 169, 2 

Se X < 170, 0 

VI 

H = 172 

£7 = 12 

0,1056 

NR 

NR 

NR 

Se X < 162, 7 

Se X < 165, 4 

Se X < 166, 87 


De maneira geral, de acordo com a Hipotese Alternativa, sabemos que a Regiao Cri- 
tica situa-se nas caudas da distribuigao de densidade. Assirn, para a distribuigao normal 
padrao, valores rnuito altos ou muito baixos da estatlstica Z ca i cu i a do indicariam uma ten- 
dencia de rejeigao de Hq : /j, = /jlq . Dessa forma, pelo estudo dessa Estatlstica, notamos 
que \x — hq\ , a e n sao os fatores que contribuem para a decisao em se rejeitar, ou nao, 
Hq. Logo, verificamos que: 
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• Um aumento na diferenga observada, x — po, contribuira na tendencia em se rejeitar 
H 0 ; 

• Um aumento na variabilidade dos dados, a, contribuira para a nao rejeigao de Ho', 

• Um aumento no tamanho da amostra, n, contribuira para a rejeigao de Hq- 

Nesse contexto, comparando-se o Exemplo 5.2 com a Situagao I, da Tabela 5.6, 
notamos que, ernbora as decisoes sejarn as mesrnas para x = 167, pela Regra de Decisao 
adotada, o valor de x Q b s do Exemplo 5.2, com a = 0,01, esta praticamente no limite da 
Regiao Critica, ou seja, quase rejeitamos Ho, o que poderia nos causar uma duvida maior 
na decisao em comparagao a Situagao I. Veja que o unico fator modificado nesses dois 
casos foi a suposigao em torno da media. Dessa forma, a diferenga observada, \x — po\, no 
Exemplo 5.2 e superior a diferenga para a Situagao I, 4 contra 3, respectivamente. Daf, e 
intuitivo pensar que quanto mais distante se encontrar a estimativa da media, x Q b s , do valor 
suposto em Ho, po, maior sera a tendencia em se rejeitar Hq- Agora, se compararmos a 
Situagao I com a II, verificamos que apenas o fator variabilidade, a, foi alterado. O 
aumento de a de 9 para 10, acarretou nurna mudanga na decisao acerca de Hq. Passamos 
a nao rejeitar Ho quando a variancia aumentou. E evidente que isso poderia acontecer, pois 
a fungao de probabilidade tornou-se mais platicurtica, portanto com caudas menos densas, 
possuindo, assim, uma quantidade maior de amostras de tamanho 27, cujas estimativas da 
media resultassem em valores menores do que 167 cm. Essa ideia fica, de fato, evidenciada 
pela observagao das Regras de Decisao, que indicam, para um mesmo nivel de significancia, 
valores sernpre inferiores de para a Situagao II. Ou seja, para a = 0, 05, temos, para a 
Situagao I, 5% das possfveis amostras com estimativas da media inferiores a 167,2 cm e 
para a Situagao II temos 5% com valores menores do que 166,8 cm. 

Nesse contexto, note que na Situagao III diminuimos ainda mais o valor de a. Logo, e 
de se esperar que a estimativa, x Q b s = 167 cm, seja mais representativa comparativamente 
com as situagoes anteriores, pois n e po permaneceram os mesmos. Assim, a diferenga 
observada, \x — po\ = 3, tambem sera mais representativa para a Situagao III. Ernbora 
essa diferenga seja a mesma para as tres situagoes, esperamos que a diferenga associada 
a Situagao III, nao tenha ocorrido por acaso, indicando, portanto, uma tendencia de que, 
independentemente da amostra coletada, esperamos que na grande maioria das coletas, 
x 0 bs seja inferior a 170 cm. Quando isso ocorre, dizemos que a diferenga foi significativa. A 
interpretagao seria analoga a essa se o tamanho da amostra fosse aumentado e os demais 
fatores permanecessem constantes. 

Na Situagao II, se coletassemos inumeras amostras, varias delas forneceriam esti- 
mativas menores do que 170 cm e muitas outras resultariam em valores superiores a 170 
cm, inrplicando, assim, que a diferenga deve ter ocorrido por acaso, nao havendo uma 
tendencia. Dessa forma, nao seria conveniente decidirmos que p < 170, e sim, concluirmos 
que a diferenga nao foi grande o suficiente (nao foi significativa) a ponto de descartarmos 
Hq. Logo, p poderia ser 170 cm. Por outro lado, por se tratar de amostragem, tambem 
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nao poderfamos afirmar que p = 170. Porem, deverfamos afirmar que provavelmente p 
nao e menor do que 170 cm. 


Ao compararmos as situagoes III, IV e V, verificamos que os P-valores sao os mesmos. 
Portanto as decisoes sao rigorosamente as mesmas. Porem, note que, pelas Regras de 
Decisao adotadas, os valores de x cn q.j co sao bem diferentes para essas tres situagoes. 
Veja que na Situagao IV, quase rejeitamos Hq para a = 0,01, pois £ c riti co = 167,1 
e x 0 b s = 167, resultando nurna diferenga de apenas 0,1 cm. Ao contrario da Situagao 
III, cuja diferenga foi de 1,7 cm. Porem, teoricamente, essa observagao esta equivocada, 
pois, apenas poderiamos ter essa impressao porque as diferengas sao aparentemente muito 
distintas. Mas, e imprescindivel notarmos que, tanto essas diferengas quanto os intervalos 
associados a elas, ernbora bem diferentes, sao equivalentes uma vez que suas distribuigoes 
sao distintas. Assirn, deverfamos verificar que, tanto no intervalo 167 < Xm < 168, 7, 1 
quanto no intervalo 167 < Xjy < 167, 1, ha o mesmo mimero de possfveis amostras (n = 
27). Ou seja, P(167 < X in < 168,7) = P(167 < X IV < 167,1) = 0,053, pois X HI ~ 
N( 170;6 2 /\/27) e X IV ~ N( 168; 2 2 /\/27)- Assirn, se dissermos que quase rejeitamos Hq 
na Situagao IV, devemos dizer o mesmo para a Situagao III. Alern disso, note que ernbora 
a suposigao para a Situagao IV e de p = 168 e para a Situagao V seja de p = 173, as 
decisoes tambem sao as mesmas. Ainda que as diferengas observadas sejarn de 1 cm e de 
6 cm, respectivamente, nao podemos nos esquecer que o desvio padrao e tambem outro 
fator responsavel pela tomada de decisao. Logo, notamos que o desvio padrao da Situagao 
IV e seis vezes menor, implicando, portanto, em estimativas ( x a b s ) bastante proximas de 
po, caso Hq seja verdadeira. Dessa forma, e de se esperar que as diferengas observadas na 
Situagao III estejam mais proximas de zero do que para a Situagao V. 


Finalmente, na Situagao VI, tem-se um tamanho de amostra tres vezes menor do que 
nas situagoes anteriores e, tambem, o rnaior desvio padrao dentre todas as situagdes. Note 
que, mesmo para uma media suposta de 172 cm, encontramos um P-valor que resulta em 
rejeigao para todos os nfveis de significancia adotados na Tabela 5.6. Comparativamente, 
ve-se que a diferenga observada na Situagao IV e de 1 cm e na Situagao VI e de 5 cm. 
Porem, a primeira diferenga foi significativa, enquanto a segunda, nao. 


Com vimos, ha uma probabilidade de nao rejeitar Hq quando ela e falsa, ou seja, 
tomamos a decisao de que p = po quando, na verdade, nao e. Obtem-se essa probabilidade 
calculando-se (3 =P(Nao Rejeitar Hq\Hq e Falsa). Veja que se nao rejeitamos Hq, decidimos 
que p = po, portanto /3 sera calculado em fungao de p = po, ou seja, em fungao de 
X ~ N(po, a 2 /n) . Porem, tambem para obtermos j3 e necessario que seja escolhido um 
outro valor para p, uma vez que Hq e falsa, por exemplo, p = p* = 169 cm. Portanto, 
para o Exemplo 5.2, terfamos, para a = 0, 05: 
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(3 = P( Nao RejeitarTTol-^o e Falsa) 
= P(X obs > ^criticol^ =169) 


= P[Z> 


x — 169 


= P[Z> 


168,2 - 169 
9/x/27 


0,678 


Graficamente, teriamos (Figura 5.2): 



Figura 5.2: Probabilidade de nao rejeitar Hq quando ela e falsa. 

Note que a expressao x obs > ^ cr fti C o es ^ associada a Regra de Decisao com base 
em Hq: p = hq = 171. Por isso, ® cr fti co = 168,2 para a = 0, 05 (veja Tabela 5.6). 
Mas, o valor de /3, deve ser obtido por meio da probabilidade condicional que depende da 
media suposta (po) e da media real (p*). Assim, ao transformarmos ® cr fti co em ^critico’ 
devemos primeiramente levarmos em consideragao po = 171, para a obtengao de ^ cr ftico’ 
e posteriormente p* = 169, para o calculo final de f3. 

Vejamos, na Tabela 5.7, com base no Exemplo 5.2, o que ocorreria com o valor de 
/3, criadas novas situagbes com mudangas nos valores de a, a, n e p* e, conseqiientemente, 
com o Poder do Teste, 1 — f3(p*). 


5.4. Alguns Testes Parametricos mais Utilizados. 
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Tabela 5.7: Valores de 1 — ) para o exemplo 5.2 de acordo com os prametros a, o, n 

5k 

e fi . 




a = 0, 01 

a = 0, 05 

a = 0, 10 

Situagao 


1 - p{jn*) 



I 

/i* = 169 ;cj = 9; n = 27 

0,121 

0,322 

0,454 

II 

g* = 169;ct = 9; n = 200 

0,793 

0,933 

0,969 

III 

fj* = 169;cr = 2; n = 27 

0,998 

0,9998 

^ 1 

IV 

/T = 172;<t = 9; n = 27 

0,002 

0,0013 

0,032 

V 

/i* = 166;cr = 9; n = 27 

0,712 

0,893 

0,946 

VI 

yU* = 169;u = 9; n = 9 

0,048 

0,164 

0,269 


Notamos, claramente, que independentemente da situagao, que a medida que a 
cresce, (3 diminui. Ou seja, o poder do teste aumenta e teriamos uma menor chance de 
errarmos na decisao de nao se rejeitar Hq quando Hq e falsa. 

Pela comparagao das Situagoes I, II e III verificamos que, independentemente do 
valor de a, o poder do teste aumenta consideravelmente de I para III, passando por II. 
Como fi* se manteve constante, os fatores a e n foram responsaveis diretos para que o poder 
se modificasse. Alern disso, note que o aumento verificado no tamanho da amostra de I para 
II, de quase 7,5 vezes, contribuiu rnenos para urn aumento do poder, do que a diminuigao 
no desvio padrao de 9 para 2, 4,5 vezes, verificada entre as situagoes I e III. Porem, como 
nao podemos interferir ern fi* e a para a obtengao do poder, resta-nos trabalharmos com n. 
Assirn, se quisermos testes mais poderosos, devemos, ern principio, aumentar o tamanho 
da amostra. Nesse contexto, compare a Situagao I com a V e posteriormente, reflita sobre 
as demais situagoes consideradas na Tabela 5.7. 

Vejamos, agora, alguns testes mais utilizados. 


5.4 Alguns Testes Parametricos mais Utilizados. 

5.4.1 Teste para a media (yu) com cr 2 desconhecida. 

O objetivo desse teste e verificar a hipotese Hq \ /i = hq. Porem, como cr 2 e des- 
conhecida, podemos estima-la, obtendo-se s 2 , por meio da mesrna amostra utilizada para 
a obtengao de X 0 b s . Portanto, a diferenga fundamental desse teste para o teste descrito 
na Situagao II do Exemplo 5.2, em que o 2 era conhecido, e dada pelo comportamento das 
estimativas de X 0 b s vindas das possiveis amostras de tamanho n. Enquanto na Situagao I 
X Q bs seguia uma distribuigao Normal (apenas X Q b s varia, a 2 e constante), na Situagao II, 
tanto X D bs quanto a 2 variam, logo, outra distribuigao devera representar esse comporta- 
mento. Nesse caso, sabemos que a distribuigao a t de Student, podera se ajustar a essas 
estimativas. 
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Porern, a medida que n cresce, os testes tendem a ser equivalentes, pois os valores 
de Z e t se aproximam. Dessa forma, os P-valores estarao bastante proximos, para n > 30, 
e, conseqiientemente, a decisao em relagao a Hq sera praticamente a mesma. 

Exemplo 5.3. Uma maquina enche pacotes de cafe de uma marca X deve completa-los, 
em media, com no minimo 500 g. Se coletassemos de uma amostra aleatoria de tamanho 
16, a fim de verificarmos se a maquina se encontra regulada, e obtivessemos uma media 
igual a 495 g e desvio padrao de 5 g, seria plausivel concluirmos que a media e menor do 
que 500 g, ou seja, a maquina se encontraria regulada? 

Os dados observados sao: 498,8; 503,1; 497,6; 491,6; 499,3; 491,3; 499.8; 492.1; 498.1; 
493.2; 487.2; 489.8; 495.8; 498.2; 498.8; 485.7 

Solugao: Devemos proceder ao Teste Parametrico, segundo as etapas descritas no 
item 5.2.5. Assirn: 


1. Estabelecer as Hipoteses Nula e Alternativa; 

Ho : p = 500g vs H\ : p < 500 g 

2. Identificar a Distribuigao Amostral associada ao Estimador e obter a Estimativa do 
Parametro; Distribuigao Amostral: t de Student com 15 g.l.. Pois, n < 30 e a 2 
desconhecida; 

Estimativas: X Q b s = 495 g e s = 5g 

3. Fixar um valor para o Nivel de Significancia (a) e obter a estatistica de teste do 
Parametro por meio da Estatistica do Teste; 

Nivel de Significancia: a = 0, 01 

Estatistica de teste: 

A o6s - po 495 - 500 

^ calculado / / — _ , /— — - ^ 

s/yjn 5/v 16 

Logo: P-Valor=P(t < —4,0) = 0,0006. 

4. Construir a Regiao Critica (RC) com base na Hipotese Alternativa e no valor de a 
e estabelecer a Regra de Decisao (RD); 

A Regiao Critica e a area hachurada cuja probabilidade e igual a a = 0, 01. Observe 
a Figura 5.3 associada a RC. 

Assirn, qualquer valor de t ca i cu i a d 0 menor do que -2,602, pertencera a RC. Ou seja, 
RC = {t G < —2,602}; P{t < —2,602) = 0,01. Agora, transformando t = 
-2,602 em X , obtemos o X cr ^ co , assirn: 


-2,602 


"^critico . = 

5/\/T6 crftlco 


496, 75. 
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. Logo, qualquer valor da media estimada, X 0 b s , inferior a 496,75 g, pertencera a 
RC. A Figura 5.4 ilustra essa ideia. 

Regra de Decisao: 

Sg t caiculado tico ■ 602, ou seX Q fr s <Z 495, 75 g , optanros em 

rejeitar Hq : g = 500 g. 

5. Concluir o Teste: Como a Estimativa do Parametro ( X a b s = 495 g) pertence a Regiao 
Critica, rejeitamos a Hipotese Nula. Dessa forma, podemos concluir que: 

• a diferenga observada (495 — 500) foi significativa; 

• a estimativa da media, 495 g , nao deve ter ocorrido por acaso. Assim, se 
refizermos o experimento inumeras vezes, esperarfamos que os valores obtidos 
para X 0 b s fossem, na sua grande maioria inferiores a 500 g, indicando, portanto, 
uma tendencia; 

• conforme a probabilidade (P-Valor), cujo valor esta associado a ocorrencia de 
estimativas da media menores do que 495 g, que X Q b s = 495 g, sob Hq, e raro 
(veja a Figura 5.5); 

• Consequentemente, de acordo com essas conclusoes, seria plausivel admitirmos 
que g deve ser menor do que 500 g, indicando que a maquina, provavelmente, 
esteja desregulada. 
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5.4.2 Teste para a comparagao de duas medias populacionais {)i\ e /i 2 ) 

O objetivo desse teste e verificar se a diferenga suposta (D) em Hq entre g\ e /r 2 
pode ser considerada significativa. Ou seja, a Hipotese Nula sera dada por: 


Hq : fii — g2 — D. 

A fim de procedermos ao teste corretamente, devemos observar, primeiramente, 
se as amostras (rol e n2) provenientes das duas populagoes sao independentes ou nao. 
Caso sejam, torna-se primordial a realizagao de urn teste para se verificar se as variancias 
diferem. Pois, as metodologias para as realizagoes dos testes diferem. Logo, as decisoes 
acerca da comparagao entre e /r 2 podem diferir. Por outro lado, se as amostras forem 
dependentes, um outro teste especifico devera ser realizado. Esquematicamente, terfamos: 
Comparagao entre gi e g 2 


Comparagao entre fi± e /r 2 < 


ur = 

amostras independentes < 
Amostras Dependentes Teste 


o\ — > Teste 
o\ — > Teste 


Note, entao, que antes de compararmos as duas medias, e fundamental que fagamos 
primeiramente um teste para a verificagao da homocedasticidade (Hq : af = a^). Assim, 
poderemos efetuar o teste adequado para testar Ho : gi — g 2 = D. Dessa forma, as etapas 
do Teste para compararmos as duas variancias, fica: 


1. Estabelecer as Hipoteses Nula e Alternativa; 

Ho : o\ = cr 2 vs H\ : o\^ a\ 

2. Distribuigao Amostral: F de Snedecor, que sob Ho, e dada por: F ( at b, a ), sendo a e b 
os numeros de graus de liberdade do numerador e denominador, respectivamente; 

Estimativas:sf e s 2 ; 

3. Nivel de Significancia: a = a o 

Estatfstica: F ca i cu i a d 0 = • Note que, embora H\ : af / a\, como o nume- 

rador sera maior do que o denominador, F ca i cu i a( j_ 0 sera maior do que 1. Logo, o teste 
adotado sera o unilateral a direita; 

4. Regiao Critica (RC): valores de F > T cn qi co = EiafteZado = T(a,6,a 0 ) pertencerao a 
RC; 

5. Concluir o Teste: Se F ca i cu i a ^ 0 pertencer a Regiao Critica, rejeitamos a Hipotese 
Nula. Caso contrario, nao. 


Feitas as observagoes, vejamos os testes 5.4.3, 5.4.4 e 5.4.5. 
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5.4.3 Teste para amostras independentes com o\ = of. 

As amostras serao consideradas independentes (ou nao correlacionadas, ou nao pare- 
adas, ou nao emparelhadas) se a ocorrencia de um valor especifico retirado da populagao 1, 
nao interferir, ou mesmo nao estiver correlacionado com a observagao colhida da populagao 
2. Nesse contexto, observe os casos seguintes: 

Caso 1) Qual das duas ragbes A e B proporcionaria um maior ganho de peso medio, 
ern 20 dias, numa determinada raga de animal? 

Note que os animais que receberao a Ragao A sao diferentes daqueles que receberao 
a Ragao B. Veja, tambern, que o ganho de peso de um certo animal que recebeu a ragao A 
nao interferira no ganho de peso de qualquer outro animal em que administramos a ragao 
B. Alem disso, podemos ter tamanhos de amostra diferentes para as duas ragoes. Logo, 
as amostras podem ser consideradas independentes. 

Caso 2) Sera que uma determinada ragao A atinge um ganho de peso medio igual a 
po, em 20 dias, numa determinada raga de animal? 

Observe que nesse caso, para sabermos se houve, de fato, um ganho de peso desejado, 
precisariamos observar os pesos dos n animais da amostra antes da ragao ser administrada 
e apos os 20 dias considerados. Assim, ha uma amostra inicial, associada ao inicio do 
tratamento com a ragao, e uma amostra associada ao termino do tratamento com a ragao 
A. E, com base, nos pesos iniciais e finais desses n animais, podemos estabelecer o ganho de 
peso individual, e conseqiientemente, o ganho de peso medio por intermedio da diferenga 
observada entre os pesos. Portanto, so obteremos o ganho de peso medio se tivermos as 
duas informagoes obtidas de um mesmo animal. Logo, flea evidente que essas informagbes 
sao dependentes. Ou seja, sao pareadas. 

Exemplo 5.4. Vamos utilizar o Caso 1, com as seguintes informagoes: A Ragao A foi 
administrada em 8 animais (ha) e observou-se uma media de 3,12 kg (xa) e um desvio 
padrao de 0, 15 kg (s^). Ja na Ragao B, obtivemos xb = 3,05 kg e sb = 0, 11 kg para 
ns = 10. Vejamos, portanto, se a ragoes diferem em relagao ao ganho de peso. Esse 
problema pode ser resolvido por meio de um teste parametrico. Porern, qual metodologia 
devemos utilizar? As referentes aos testes 5.4.3, 5.4.4 e 5.4.5? Como ja discutido, as 
amostras sao independentes. Portanto, devemos, antes de proceder ao teste, verihear se . 
Assim, as etapas do teste beam: 

Os dados utilizados sao: 

Ragao A: 3,40; 2,99; 3,21; 3,07; 3,01; 3,27; 3,23; 3,02. 

Ragao B: 2,82; 3,16; 2,98; 3,04; 3,15; 3,20; 3,00; 3,01; 3,08; 3,06. 

1. As Hipoteses: Hq : = cr 2 B vs Hq : <j\> cr 2 B 

2. Distribuigao Amostral: Sob H 0 , = F tabdado = F(7,9,a 0 ). 

Estimativas: s\ = 0, 15 2 e s 2 B = 0, ll 2 

3. Nivel de Signihcancia: a = ao = 0, 05 (por exemplo) 


5.4. Alguns Testes Parametricos mats Utilizados. 
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Estatistica. Pcaicuiado (|'| ] 2 1.8595. 

s 2 

4. Regiao Critica (RC): valores de ~4~ > 3,293 pertencem a RC; 

S B 

Regra de Decisao (RD):se F ca i cu i ado > F tabe i ado = 3,293, rejeita-se H 0 . 

5. Concluir o Teste: Como F ca i cu i ado nao pertence a RC, nao se rejeita Hq : a\ = a B . 
Logo, ha homocedasticidade e o teste 5.4.3 devera ser o escolliido. 

Dessa forma, o teste fica: 

1. As Hipoteses: 

H 0 : ha ~ PB = 0 g vs H t : g A ~ Pb / 0 g 

Note que, neste caso, D = 0. Pois o objetivo e apenas verificar se existe diferenga 

significativa entre o ganho de peso medio das ragoes. Porem, D G K, assim, pode- 

rfamos estar interessados em investigar se D = 0, 05. Ou seja, sera que a Ragao A 
proporciona um ganho de peso superior ao da Ragao B em pelo menos 50 gl 

2. Distribuigao Amostral: t de Student com 7 g.l.. 

Pois, riA + ns < 30 e as variancias sao desconhecidas. 

Sendo 7 = ha + ns — 2 = 8 + 10 — 2 = 16 g.l.; 

Estimativas: xa = 3, 12; = 0, 15 ; xb = 3, 05 e sb = 0, 11 

3. Nivel de Significancia: a = 0, 05 
Estatistica de teste: 


tcalculado — 


(x A ~ X B ) - (PA - Pb) 


3,12-3,05 


— — I — — 

n A n B 


0,1290 Jh + jo 


Como as variancias nao diferem, calculamos uma variancia comum dada por: 

2 _ (rtA-l)s 2 +(^- 1 )^ 
c n A +n B — 2 

Logo: P-Valor=P(t > 1, 143) = 0, 1348 


4. A Regiao Critica e a area hachurada cuja probabilidade e igual a a = 0, 05. Observe, 
entao, que: 

RC = {t G 4i|f < —1, 746} ou i > ^ cn 'ti co = 746 

ou 

RC = {{xa — x B ) £ K|(^a — x B ) < —0, 11 ou {xa — x B ) > 0, 11} e 
P{t > 1,746) = 0,05, 

Regra de Decisao: Se t ca i cu i ado > 1, 746, ou se {{xa — x B )) > 0, 11 kg, rejeitamos Hq. 
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5. Concluir o Teste: como (xa ~ %b) = 0,07 nao pertence a Regiao Crftica, nao rejei- 
tamos a Hipotese Nula. Dessa forma, podemos concluir que: 

(a) a diferenga observada (3, 12 — 3, 05) nao foi significativa; 

(b) a estimativa ( xa~xb ) = 0, 07 deve ter ocorrido por acaso. Assirn, se refizermos 
o experimento inumeras vezes, esperariamos que os valores obtidos para (xa — 
xb) fossem, ora maiores do que zero e ora inferiores a zero, indicando, portanto, 
a ausencia de tendencia; 

(c) conforme a probabilidade (P — Valor = 0, 1348), notamos que, sob Hq, a esti- 
mativa obtida (0,07) nao e rara; 

(d) Consequentemente, de acordo com essas conclusoes, seria plausivel admitirmos 
que pa = Pb- Portanto, as ragbes possuem, provavelmente, o mesmo efeito no 
ganho de peso desses animais. 

5.4.4 Teste para amostras independentes com a\ ± o\ . 

Vejamos, agora um exemplo para o caso em que as variancias diferem. 

Exemplo 5.5. Um experimento com o objetivo de verificar a resistencia (kgf) de dois 
tipos de concreto foi realizado. Os dados sao os seguintes: 

Tabela 5.8: Resistencia (kgf) de dois tipos de concreto. 


Concreto 1 

101,2 

102,0 

100,8 

102,3 

101,6 

Concreto 2 

100,0 

102,8 

101,5 

99,0 

102,0 


Pede-se: Ha evidencia de que o Concreto 1 seja rnais resistente do que o Concreto 
2? Estabelega a = 0, 05. 

Solugao: Embora nl = n2 = 5, nota-se claramente que as amostras nao sao pareadas. 
Alem disso, F ca i cu i ado=6M>Ftabelado=6 ^ 9 , logo . Portanto, o teste fica: 

1. As Hipoteses: FIq : p\ — p 2 = 0 vs H\ : p\ — p 2 > 0 

2. Distribuigao Amostral: t de Student com 7* g.l.. 

Sendo 7* dado, por exemplo, pela formula de Aspin- Welch com arredondamento 
para menos: 


* _ (vi + V2) 2 

1 ~ K/(«1 + 1)] + [»7(n 2 + 1)] 



n 1 



n 2 


Assirn, 7* = 5, 79 =>• 7* = 5 g.l. 
Portanto, t tabe i ado = 2, 015 
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3. Nivel de Significancia: a = 0, 05 
Estati'stica de teste: 


tcalculado 


(Xl - X 2 ) ~ (fJLl ~ H 2 ) 



101,6 - 101,1 



2,368 

5 


Logo: P — Valor = P(t > 0, 67) = 0, 2643. 


4. Regiao Critica: RC = [t, £ 9i|i > 2,015}; P(t > 2,015) = 0,05, ou RC = {{x\ — 
x 2 ) <E 3? | > 1,49} 

Regra de Decisao: Se t ca i cu i a d 0 > t cr fti co > ou se (xi~x 2 ) > 1, 49, optamos ern rejeitar 
H 0 . 

5. Concluir o Teste: Como t ca i cu i a d 0 = o ,67 (ou {x\ — x 2 ) = 0,5) nao pertence a Regiao 
Critica, nao rejeitamos Hq : m — n 2 = 0. Logo, concluimos que nao ha evidencia 
estati'stica, estabelecendo-se urn nivel de significancia de 0,05, de que o Concreto 1 
seja mais resistente do que o Concreto 2. 


5.4.5 Teste para amostras dependentes 

No caso ern que duas amostras estao correlacionadas segundo algum criterio (por 
exemplo o caso antes e depois), dizemos que aos dados estao emparelhados (veja o Caso 
2 do item 5.4.3). Assirn, devemos calcular as diferenqas (d*), para cada par de valores, 
obtendo-se uma rinica amostra de n diferengas (nl = n2 = n). Entao, testar a hipotese 
de que a diferenga entre as rnedias das duas populagoes pareadas e igual a um certo valor 
Do, equivale a testar a hipotese de que a media de todas a diferengas (gd) seja igual a Do, 
ou seja: 

Dq ■ /T 1 g 2 — Do \ V Ho ■ /i Antes dDepois — Do ' !' Hq ■ gd — Dq 

Dessa Forma, retornamos ao item 5.4.1 em que testamos Hq : g = /j,q. Entao, de 
forma analoga, a Estati'stica do Teste e dada por: 


tcalculado 


d — Dp 
Sd/y/n 


em que: 

d e a media da amostra da diferengas; 

Dp e o valor suposto para a media das diferengas; 
Sd e o desvio padrao da amostra das diferengas; 
n e o tamanho da amostra pareada. 

Vejamos um exemplo: 


Exemplo 5.6. Um novo medicamento esta sendo pesquisado com intuito de diminuir a 
pressao sistolica em individuos hipertensos. Dez pacientes voluntarios submeteram-se ao 


94 


Testes de Hipoteses 


Camarinha Filho, J. A. 


Tabela 5.9: Pressao antes e apos seis meses da adiminstragao do medicamento. 


Antes 

179 

200 

161 

170 

181 

190 

202 

220 

195 

165 

Apos 

160 

180 

161 

180 

165 

170 

196 

216 

170 

160 

Diferenga (di) 

-19 

-20 

0 

10 

-16 

-20 

-8 

-4 

-25 

-5 


tratamento que consistia em medir a pressao antes e apos seis meses da administragao do 
medicamento. Os dados sao os seguintes (Tabela 5.9): 

Voce acreditaria que o medicamento surte o efeito desejado, com a = 0, 01? 
Solugao: Etapas do teste: 

1. As Hipoteses: Hq : = Dq = 0 vs Hi : / 0 

2. Distribuigao Amostral: t de Student com (n — 1) g.l. = 9 g.l.; 

Poitanto, ttabelado — 3,25 

Estimativas: d = —10,7 e Sd = 11,066 

3. Nivel de Significancia: a = 0, 01 
Estatistica de teste: 


-10,7-0 

tcalculad ° ~ 11,066/^10 
Logo: P-Valor=P(f < —3,06) = 0,007 

4. Regiao Cn'tica (RC): RC = {t E 3f?|t < —3,25 }ou{t > 3,25} = {d 6 3?|d < 
-11,37 ou d> 11,37}. 

Regra de Decisao: Se t ca i cu i a do < —3, 25, ou se d < —11, 37 , rejeitamos Hq. 

5. Concluir o Teste: Como d = —10, 7 > —11,37 , podemos concluir que: 

(a) a diferenga observada (- 10,7) nao foi significativa; 

(b) pelo resultado do P-Valor, podemos dizer que provavelmente a amostra das 
diferengas nao e rara; 

(c) Assirn, concluimos que o medicamento nao obteve urn resultado desejado. 


5.5 Teste para Proporcao Populacional (p) 

O objetivo desse teste e verificar se a proporgao verdadeira (populacional) nao difere 
de um valor suposto po- Dessa forma, dada uma populagao, cuja variavel aleatoria X estuda 
o numero de sucessos em n observagoes, coletamos uma amostra aleatoria (n) e verificamos 
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o numero de sucessos ocorridos (k). Assim, podemos obter a proporgao (porcentagem) 
estimada de sucessos (p = e concluir a respeito do valor suposto po- 
De acordo com o item 2.5, vejamos um exemplo. 

Exemplo 5.7. Um Candidate A a Reitor da UFPR afirma que 57% (po) dos professores 
irao votar nele na proxima eleigao. 0 Candidato B, desconfiado desse percentual, resolveu 
encomendar uma pesquisa de intengao de votos para verificar a autenticidade dessa afir- 
magao. Apos a coleta de uma amostra aleatoria de 200 professores (n), constatou-se que 
98 (k) tinham a intengao de votar no Candidato A. Segundo a pesquisa, qual a conclusao 
deveriamos tomar, ao mvel de 0,05 de probabilidade, em relagao a afirmagao do Candidato 
A? 

As Etapas: 

1. As Hipoteses: Hq : p = po = 0, 57 vs Hi : p < 0, 57. 

Optamos por H\ : p < 0, 57, pois o Candidato B desconfiou da afirmagao do Candi- 
dato A; 

2. Distribuigao Amostral: a Estatfstica p segue uma distribuigao aproximadamente 
normal, isto e, 


- nr P( 1 -P)^ 

p ~ N (p; ) 

n 

Portanto, z tabe i ado = -1,64. 

Estimativas: p = ^ ^ = 0, 49 ; 

3. Nivel de Significancia: a = 0, 05 

Estatfstica de teste: z ca i cu i ado = -/=§= ■ 

V n 

Que, sob H 0 verdadeira, tem-se: 


Zcaicuiado — 


0,49-0,57 


0 , 57 ( 1 - 0 , 57 ) 

200 


-2,285 


Logo: P-Valor=p(Z < —2,285 = 0,0112) 

4. Regiao Crftica (RC): RC = {Z G < -1,645} = (p G K | p < 0,5124}; 

Regra de Decisao: Se z ca i cu i ado < —1,645, ou se p < 0,5124, rejeitamos Hq. 

5. Concluir o Teste: Como p < 0,5124 , podemos concluir que, provavelmente, a afir- 
magao do Candidato A nao e verdadeira. 
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5.6 Teste para a Comparacao de duas Proporcoes Popula- 
cionais (jpi e P 2 ). 

E um teste similar ao anterior. Porem, comparamos, nesse caso, as proporgoes entre 
duas populagoes. 

Exemplo 5.8. Os engenheiros da Industria Romi de tornos anunciaram que um novo 
torno, desenvolvido por eles, produz eixos dentro das especificagoes com uma porcentagem 
rnaior do que seu concorrente para serem utilizados ern automoveis. Uma pesquisa foi 
realizada para se verificar a autenticidade do anuncio. Foram retiradas duas amostras 
aleatorias independentes e encontrando-se: 171 eixos em 180 dentro da especificagao para 
a ROMI, e 171 eixos em 190 para a concorrente. Qual conclusao devemos tomar, se 
admitirmos um nivel de significancia de 0,01? 

Solugao: As etapas do teste: 

A variavel associada ao teste e: X: numero de eixos dentro da especificagao em np. 
i= Romi; Concorrente. 

1. As Hipoteses: 

Hq ■ PRomi — PConcorrente VS H\ . PRomi P PC oncorrente 

Note que H\ : pR om i > PConcorrente , pois os Engenheiros da Romi disseram que seus 

tornos sao superiores em relagao a variavel X\ 

2. Distribuigao Amostral: a Estatfstica pr — pc segue uma distribuigao aproximada- 

rnente normal, isto e, 


at / Pr{^-Pr) . pc{l-pc), 

Pr — Pc ~ N[pr - pc ; 1 ). 

nR nc 

Portanto, z ta beiado = 2, 33. 

Estimativas: p R = ^ = gg = 0, 95 e p c = ^ = °> 90 

3. Nivel de Significancia: a = 0, 01 
Estatfstica de teste: 


Z. 


calculado 


(Pr ~ Pc ) - (pr ~ Pc ) 




N( 0,1) 


Em que, p = n ^+ n cPc = . 

H ^ nu+nc nu+nc 

Que, sob Ho verdadeira, tem-se: 

Z calculado — 


(0, 95 - 0, 90) - (0) 


^0,9243(1 - 0, 9243)^ + ^) 


Logo: P - Valor = P(Z > 1, 8176) = 0, 0346 


5. 7. Testes nao Parametricos 


97 


4. Regiao Crftica (RC): 

RC = Z E dt\Z > 2, 33 = {( pr - pc ) G K| > (p R - p c ) > 0, 064}; 

Regra de Decisao: Se Z ca i cu i a( i 0 > 2,33, ou se (p R — pc) > 0,064, rejeitamos Ho. 

5. Concluir o Teste: Como (p R — Pc) = 0, 05 < 0, 064, podemos concluir que, provavel- 
mente, o anuncio feito pelos engenheiros nao precede. 

5.7 Testes nao Parametricos 

5.7.1 Teste de aderencia 

Verifica-se nesse teste a adequabilidade de um modelo probabilfstico de uma variavel 
X a um conjunto de dados observados, que serao divididos em categorias. Ou seja, verifica- 
se se os dados de uma amostra se ajustam, de forma satisfatoria, a um modelo proposto. O 
princfpio basico deste metodo e comparar proporgoes obtidas com auxflio das freqiiencias 
obtidas dentro de cada categoria, isto e, comparam-se as possfveis divergencias entre as 
freqUencias observadas e esperadas para um certo evento. Assim, as hipoteses testadas 
sao: 

1. Hipotese nula (Ho): X segue o modelo proposto. ou ainda, as freqiiencias observadas 
sao iguais as freqiiencias esperadas, assim, nao existe diferenqa entre as freqiiencias 
(contagens) dos grupos. 

2. Hipotese alternativa: X nao segue o modelo proposto. Ou seja, existe ao rnenos uma 
freqriencia observada que difere de sua freqiiencia esperada correspondente. 

Nesse contexto, construirfamos uma tabela auxiliar da seguinte forma: 


Tabela 5.10: Tabela auxiliar. 


Categoria (hi) 

1 

2 

3 


k 

Freq. Observada 

Oi 

o 2 

Os 


Ok 

Freq. Esperada e* 

ei 

e2 

S3 


& k 


Karl Pearson propos a seguinte formula para medir as possfveis discrepancias entre 
proporgoes observadas e esperadas: 


<? 2 = £ 


(' Oi - 


e-i 


2 


ei 


em que, 

k e o numero de classes (categorias) consideradas; 
Oi e a freqiiencia observada; 
ei e a freqiiencia esperada. 
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Note que as freqiiencias observadas sao obtidas diretamente dos dados das amostras, 
enquanto que as freqiiencias esperadas sao calculadas a partir do rnodelo probabilfstico 
proposto pelo pesquisador, ou seja, em fungao de Hq. alem disso, como (o* - q) e a 
diferenga entre a freqiiencia observada e a esperada, quando as freqiiencias observadas 
sao muito proximas as esperadas, o valor de Q 2 tende a ser pequeno. Conseqiientemente, 
tendemos, tambem, a nao rejeitar Hq. 

Supondo-se Hq verdadeira, e possfvel demonstrar que a variavel aleatoria Q 2 segue 
uma distribuigao aproximada qui-quadrado com q graus de liberdade. Assim, 


1 ^ 

1=1 

sendo que q = k — 1 representa o numero de graus de liberdade. 

A aproximagao para o modelo Qui-Quadrado sera rnelhor, para um n grande e se 
todas as freqiiencias esperadas forem maiores do que 4 (e* > 5). Caso isso nao ocorra para 
alguma categoria, devemos combina-la com outra categoria de forma que esse requisito 
seja satisfeito. 

Com base nessa distribuigao amostral, podemos, entao, obter o P-Valor e, conseqiien- 
temente, tomarmos uma decisao em relagao a Hq. 


Exemplo 5.9. Deseja-se verificar se o numero de acidentes em uma estrada rnuda con- 
forme o dia da semana. O numero de acidentes observado para cada dia de uma semana 
escolhida aleatoriamente foram: 


Tabela 5.11: .Numero de acidentes por dia da semana. 


Dia da semana ( k ) 

Domingo 

Sabado 

Sexta 

Quinta 

Quarta 

Terga 

Segunda 

Numero de acidentes 

30 

18 

26 

13 

7 

8 

17 


Solugao: As etapas para realizagao do teste sao: 

1. Hipoteses a serem testadas: 

Hq\ O numero de acidentes nao muda conforme o dia da semana; 

H\\ Pelo menos um dos dias tern numero diferente dos demais. 

Note que, se pi representa a probabilidade de ocorrencia de acidentes no i-esimo dia 
da semana, entao, 

Hq : pi = 1/7 para todo i = 1, . . . , 7; 

H i : pi 7^ 1/7 para pelo menos um valor de k. 

2. Distribuigao Amostral: Qui-quadrado com k — 1 g.l. 

Portanto: \ 2 = 14, 449, para a = 0, 05. 

Estimativa: Total de acidentes na semana: n = 119. 
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Logo, se Ho for verdadeira, e* = 119 x 1/7 = 17; i = 1, . . . , 7. Ou seja, esperam-se, 
independentemente do dia, 17 acidentes. 

Note que se trata de uma distribuiqao Uniforme. 

3. Nivel de Significancia: a = 0, 05; 


Tabela 5.12: Quadro auxiliar com as freqriencias esperadas. 


Dia da semana (fc) 

Domingo 

Sabado 

Sexta 

Quinta 

Quarta 

Terga 

Segunda 

Nrimero de acidentes 

30 

18 

26 

13 

7 

8 

17 

Freq. Esperada 

17 

17 

17 

17 

17 

17 

17 

( Oi - ei) 

13 

1 

9 

-4 

-10 

-9 

0 


Estatistica de teste: . 


Assirn, 


<? 2 = E 


(oj - 


Si ) 2 


e-i 


q 2 = (oi - ei ) 2 + (02 - e 2 ) 2 + + (07 - e 7 ) 2 

ei e2 e7 


Q 2 


(13) 2 (l) 2 

+ + . . . + 


17 


17 


(0£ 

17 


26,35 


Portanto, X 2 ca i cu i ado = 26, 35 

Logo: P-Valor=P(x 2 > 26, 35) = 0, 0002 


4. Regiao Crftica (RC): RC = {x 2 £ ^*|x 2 > 14, 449} Regra de Decisao: Se X 2 ca icuiado > 
14,449 rejeita-se Hq. 


5. Concluir o Teste: Como xtaiculado = 26, 35 > 14, 449, podemos concluir que o modelo 
probabilistico nao e Uniforme. Assirn, conclufmos que o nrimero de acidentes deve 
variar conforme o dia da semana. 


5.7.2 Teste qui-quadrado para tabelas de contingencia 

O objetivo desse teste e verificar se existe independencia entre duas variaveis medidas 
nas mesmas unidades experimentais. 

Exemplo 5.10. Seja o exemplo: Deseja-se verificar se existe dependencia entre a renda e 
o nrimero de fillios ern famflias de uma cidade. 250 familias escolhidas ao acaso forneceram 
a Tabela 5.13: 
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Tabela 5.13: Renda e numero de filhos por familia em uma cidade. 


Renda (R$) 

Numero de filhos 


0 

1 

2 

+ de dois 

Total 

rnenos de 2000 

15 

27 

50 

43 

135 

2000 a 5000 

8 

13 

9 

10 

40 

5000 ou mais 

25 

30 

12 

8 

75 

Total 

48 

70 

71 

61 

250 


Tabela 5.14: Representagao de duas caracteristicas (A e B). 



Bi 

b 2 


B s 

Total 

Ai 

nn 

n\2 


n\ s 

n\. 

A 2 

n.2 1 

n 22 


n 2s 

n 2 . 








Tl r l 

Tl r 2 


Tips 

n r . 

Total 

n. 1 

n .2 


n. s 

n .. 


Em geral, os dados referem-se a nrensuragoes de duas caracteristicas (A e B) feitas 
em n unidades experimental, que sao apresentadas conforme a seguinte tabela (Tabela 
5.14): 

As Hipoteses a serem testadas (Teste de independence) sao: 

{ Hq : A e B sao variaveis independentes 

Hi : As variaveis A e B nao sao independentes. 

Para testarmos Hq, deveriamos verificar quantas observagoes ( mj ) devemos ter em 
cada casela. Dessa forma, seieB forem independentes, temos que, para todos os possfveis 
(At e Bj): 

P{Ai n Bj) = P{Ai ) x P{Bj) para i = 1, 2, . . . , r e j = 1, 2, . . . , s 

Logo, o numero esperado de observagoes com as caracteristicas (Aj e Bj) entre as 
n.. observagoes, sob a hipotese de independence, e dado por: 


rii n j 

Eij = n..pij = n..pi.p.j = n. . £ 

n.. n . 

sendo pij a proporgao de observagoes com as caracteristicas (Aj e Bj). Assirn, 

ni.n.j 


Eij — 


n 


O processo deve ser repetido para todas as caselas (i, j). 
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A distancia entre os valores observados e os valores esperados sob a suposigao de 
independencia pode ser obtido pela Estatfstica do teste de independencia dada por: 


2 _ V' V' ( Oij Eij) 2 


* _ = EE 

i=i j = i 


E, 




em que Oij = riij representa o total de observagoes na casela (i, j). 
Supondo Hq verdadeira, temos que: 


x 2 = 


EE 

i=i j = l 


(O^ - Eijf 


E, 




w 


sendo q = (r — 1) x (s — 1) graus de liberdade. 

A Regra de decisao pode ter como base o mvel descritivo P, neste caso, 


P = P(x 2 q > Xlbs) 

em que Xobs ® 0 valor calculado, a partir dos dados, usando a expressao apresentada para 
X 2 . Graficamente, terlamos (Figura 5.6): 



Figura 5.6: Grafico da distribuigao \' 2 . 

Se, para a fixado, obtivermos P < a, rejeitaremos a hipotese Hq de independencia. 
Vejamos, entao, a decisao que deveriamos tomar para o exemplo do estudo da de- 
pendencia entre renda e o numero de filhos. As hipoteses ficariam: 
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Hq: O numero de filhos e a renda sao independentes; 

H \ : Existe dependence entre o numero de filhos e a renda. 

O calculo dos valores esperados sob Hq (independence), fica: 
Numero esperado de familias sem filhos e renda rnenor que R$ 2000: 


E 11 


48 x 135 
250 


25,92 


Feito todos os calculos, podemos construir a tabela de valores observados e esperados 
(entre parenteses). Assim, 


Tabela 5.15: Numero esperado para numero de filhos e renda. 


Renda (R$) 

Numero de filhos 


0 

1 

2 

+ de dois 

Total 

menos de 2000 

15 (25,92) 

27 (37,80) 

50 (38,34) 

43 (32,94) 

135 

2000 a 5000 

8 (14,40) 

13 (21,00) 

9 (21,30) 

10 (18,30) 

40 

5000 ou mais 

25 (7,68) 

30 (11,20) 

12 (11,36) 

8 (9,76) 

75 

Total 

48 

70 

71 

61 

250 


Obtidos os valores esperados podemos proceder ao calculo da estatfstica de qui- 
quadrado. Logo, 


X-obs 


(15 

- 25, 92) 2 


25,92 

(30 

- 21, 00) 2 


21,00 

(12 

- 21, 30) 2 


21,30 

(10 

- 9, 76) 2 


9,76 


(25 — 14, 40) 2 , (8 — 7, 68) 2 , (27- 37,80) 2 
+ 14,40 + 7^68 + 37,80 

(13 — 11, 20) 2 ( (50 — 38, 34) 2 | (12-21,30) 2 
+ 11,20 + 38,34 + 21,30 

(9 — 11, 36) 2 | (43 — 32, 94) 2 i (8-18,30) 2 
+ 11,36 + 32,94 + 18,30 

= 36,621 


O numero de graus de liberdade sera determinado por: q = (r— 1) x (s— 1) = 2x3 = 6. 
Sendo que: 

Categorias de renda: r = 3; 

Categorias de n° de filhos: s = 4. 

Portanto,x 2 ~ xl e ; supondo a = 0,05, P(x % > 36,62) = 0,0000021 
Como P = 0, 000 < a = 0, 05, rejeitamos a independence entre numero de filhos e 
renda familiar. 


Capftulo 6 


Correlagao e Regressao Linear 


6.1 Introducao 

Considere a existencia de uma variavel quantitativa X a qual acreditamos apresen- 
tar alguma relagao com uma outra variavel quantitativa Y . Por exemplo: consumo de 
eletricidade e valor da conta de energia eletrica; idade e tempo de reagao a urn estimulo; 
temperatura e tempo de uma reagao qm'mica, dentre outros. 

Em situagoes como as citadas, a construgao de urn grafico de dispersao dos valores de 
X versus os valores de Y, se constitui numa ferramenta estatfstica simples, porem muito 
util, para investigar a existencia de uma possivel relagao entre essas duas variaveis. Adici- 
onalmente, podemos tambem fazer uso dos coeficientes de correlagao, como por exemplo, 
o de Pearson, apresentado a seguir. 


6.2 Coeficiente de Correlacao de Pearson 


O coeficiente de correlagao de Pearson e utilizado quando desejamos verificar a exis- 
tencia de associagao linear entre duas variaveis quantitativas, X eY, ee obtido dividindo-se 
a covariancia d e X eY pelo produto dos respectivos desvios-padrao de arnbas as variaveis, 
isto e: 


p = cor(X, Y) 


Cov(X,Y ) 
a x ay 


E(XY) - E(X)E(Y) 
ax cry 


( 6 . 1 ) 


Esse coeficiente resulta sernpre ern um valor entre — 1 e 1 e sua interpretagao depende 
do seu valor numerico e do seu sinal. Quanto rnais proximo de —1 e 1, rnais forte e o grau 
de relagao linear existente entre X e Y e, quanto rnais proximo de 0, rnais fraco e o grau 
desta relagao. Uma correlagao linear negativa indica que quando o valor de uma variavel 
aumenta, o valor da outra diminui e, uma correlagao linear positiva, indica que quando o 
valor de uma variavel aumenta, o valor da outra tambem aumenta. 

Para uma amostra de tamanho n, em que para cada indivfduo i ( i = 1 , ••• ,n) 
observamos os pares de valores ( Xi,yi ), o coeficiente de correlagao linear entre X eY e 
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calculado por: 


N-®) 2 ][K‘=ite-6) 2 ] 

E?=i x iVi - n %y 

sJ[T.U4-^]{Yr i= ^-n^] 


sendo x e y as medias amostrais dos x t 's e y£ s, respectivamente. 

Os graficos de dispersao apresentados na Figura 6.1 ilustram algumas situagoes com 
diferentes coeficientes de correlagao. No grafico (a) desta figura, podemos notar a ausencia 
de associagao entre X e Y. Ja nos graficos (b) e (c), podemos notar forte relagao linear 
entre X eY, pois os valores dos coeficientes de correlagao de Pearson estao muito proximos 
de 1 e — 1, respectivamente. Na situagao ilustrada no grafico (b), a rnedida que os valores 
de uma variavel crescem, os da outra tambem crescem, e isto ocorre de forma linear. Ja na 
situagao ilustrada no grafico (c), a medida que os valores de uma variavel crescem, os da 
outra decrescem, tambem de forma linear. Na situagao mostrada no grafico (d) podemos 
observar a ausencia de relagao linear entre X e Y. Neste caso, ha a presenga de uma 
relagao quadratica, ou seja, nao-linear entre elas. 



(a) r = 0,13 


(b) r = 0,99 

y 

0 5 10 15 20 

J 1 1 1 L 

• 

• • • . 

. • * •.••• 

• /•••*. • > 
A." * •• 

• • • 

_ • • * * • 

• # * *• # 

• • * * 
- * 

• • 

y 

20 40 60 80 

_l 1 1 1 1 1 1 1 

•• 

• 

m • 

■r"- 

• • 

• •* 

• • 


1 1 1 1 1 1 1 1 

2 4 6 8 10 12 14 16 

X 


1 1 1 I 1 1 1 1 

2 4 6 8 10 12 14 16 

X 


(c) r = - 0,98 
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Figura 6.1: Graficos de dispersao e coeficientes de correlagao associados. 


Do que foi apresentado, podemos observar que o coeficiente de correlagao de Pearson 
e uma ferramenta util para a investigagao de relagao linear entre duas variaveis quanti- 
tativas. A ausencia de relagao linear, quando indicada por este coeficiente, nao implica 
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na ausencia de relagao entre elas. Outro tipo de relagao pode estar presente, como, por 
exemplo, a nao-linear. 

6.2.1 Teste de significancia para p 

Na pratica, desejamos testar se a associagao linear entre X e Y e estatisticamente 
diferente de zero, bem como concluir a respeito desta associagao nao somente para a 
amostra em estudo, mas tambem para a populagao da qual a referida amostra foi extraida. 
Para tanto, uma estatfstica de teste bastante simples utilizada para testar as hipoteses: 


a qual, sob Ho, tern distribuigao t-Student com (n — 2) graus de liberdade, sendo n o 
tamanho amostral e r o coeficiente de correlagao linear entre X e Y . Calculado o valor 
dessa estatfstica, comparamos o mesmo com o valor tabelado, que e obtido a partir da 
Tabela f-Student a um nfvel de significancia a pre-estabelecido. Se o valor calculado for 
rnaior que o tabelado, podemos rejeitar a hipotese nula ao nfvel de significancia conside- 
rado. Rejeigao da hipotese nula indica que a correlagao linear observada na amostra e 
estatisticamente diferente de zero e que essa correlagao pode ser inferida para a populagao 
da qual a mesrna foi retirada. 

Exemplo 6.1. Para uma amostra de tamanho n = 80, em que a relagao entre duas va- 
riaveis quantitativas e de interesse, foi obtido para o coeficiente de correlagao de Pearson 
o valor r = 0,78. Para testar se a correlagao linear indicada por este coeficiente e estatis- 
ticamente diferente de zero, foi utilizado o teste de significancia apresentado nesta segao. 
Com base nos resultados obtidos, isto e, t ca i = 11, 0 e ttab = 1,99 ao nfvel de 5% de signi- 
ficancia (teste bilateral), podemos rejeitar a hipotese nula e, conseqiientemente, concluir 
que a correlagao e estatisticamente diferente de zero, bem como que a mesrna pode ser 
inferida para a populagao da qual a amostra foi extraida. 

Uma vez constatada a existencia de relagao linear entre duas variaveis, e de usual 
interesse descrever essa relagao por rneio de uma equagao linear. Na segao a seguir, discu- 
timos esse assunto em detalhes. 

6.3 Regressao Linear Simples 

Se uma relagao linear e valida para sumarizar a dependencia observada entre duas 
variaveis quantitativas, entao a equagao que descreve esta relagao e dada por: 


H 0 : p = 0 

H\ : p / 0 (ou Hi : p > 0 ou H\ : p < 0) 


e dada por: 



Y = l 3 0 + PiX. 


(6.2) 
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Os valores observados nao se encontram, contudo, exatamente sobre esta linha reta, 
ou seja, existe uma diferenga entre o valor observado e o valor fornecido pela equagao. 
Esta diferenga e denominada erro e e representada por e. Este erro e assumido ser um 
erro estatistico, isto e, uma variavel aleatoria que quantifica a falha do modelo em ajustar- 
se aos dados exatamente. Tal erro pode ser devido ao efeito, dentre outros, de variaveis 
nao consideradas e de erros de medigao. Incorporando esse erro a equagao (6.2) temos: 

Y = Po + (hX + e, (6.3) 

que e denominado modelo de regressao linear simples. Para cada indivfduo i (i = 1 , ,n) 
na amostra, o modelo (6.3) fica representado por: 

Vi = P o + Pi Xi + e*. (6.4) 

A variavel X em (6.3), denominada variavel regressora ou independente, e consi- 
derada uma variavel controlada pelo analista dos dados e medida com erro desprezivel. 
Ja Y, denominada variavel resposta ou dependente, e considerada uma variavel aleatoria, 
isto e, existe uma distribuigao de probabilidade para Y em cada valor possivel de X. E 
muito freqiiente, na pratica, encontrarmos situagoes em que Y tenha distribuigao Normal. 
Nesses casos, os erros e* (em que alguns sao positivos e outros negativos) sao assumidos 
serern normalmente distribuidos com media zero e variancia constante desconhecida a 2 , 
bem como independentes, isto e, o valor de um erro independe do valor de qualquer outro 
erro. Sendo assim, a media e a variancia da variavel Y serao, respectivamente: 

E(Y\X = x) = E(p 0 + p 1 x + e) = p 0 + p 1 x 
V(Y \X = x) = V(p 0 + p lX + e)=(7 2 . 

Exemplo 6.2. Um psicologo investigando a relagao entre a idade e o tempo que um 
individuo leva para reagir a um certo estunulo, obteve as informagdes apresentadas na 
Tabela 6.1 


Tabela 6.1: Tempo de reagao ao estimulo em fungao da idade. 


Vi = 

tempo (em 

segundos) 

Xi 

= idade (em 

anos) 

96 

109 

106 

112 

20 

30 

20 

35 

92 

100 

100 

105 

20 

30 

20 

35 

98 

118 

110 

113 

25 

35 

25 

40 

104 

108 

101 

112 

25 

35 

25 

40 

116 

127 

106 

117 

30 

40 

30 

40 


Fonte: Bussab, W. O. (1988). 


A partir da representagao grafica desses dados mostrada na Figura 6.2, e possivel 
visualizar uma relagao linear positiva entre a idade e o tempo de reagao. O coeficiente 
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de correlagao de Pearson para esses dados resultou ern r = 0,768, bem como sen res- 
pective teste de significance em t ca i c = 5,09, que comparado ao valor tabelado t ta b^% = 
2,1, fornece evidencias de relagao linear entre essas duas variaveis. Podemos, entao, usar 
urn modelo de regressao linear simples para descrever essa relagao. Para isso, e necessa- 
rio estimar, com base na amostra observada, os parametros desconhecidos 0q e 0\ deste 
modelo. O metodo de estimagao denominado Minimos Quadrados Ordinarios (MQO) e 
freqlientemente utilizado em regressao linear para esta finalidade e e apresentado a seguir. 


Figura 6.2: Idade versus tempo de reagao a um estimulo. 


6.3.1 Estimagao dos parametros por MQO 

Com base nos n pares de observagoes (y±, aq), (?/ 2 , # 2 ), • • • ,(y n ,x n ), o metodo de 
estimagao por MQO consiste em escolher (3q e de modo que a soma dos quadrados dos 
erros, e* (i = 1, ■ • • , n), seja minima. De (6.4) note que e* = y,; — /3q — f3\Xi. Para minimizar 
esta soma, que e expressa por: 

n n 

SQ = ^e 2 i = ^2(yi -p o - PiXi) 2 , (6.5) 

i= 1 i— 1 

devemos, inicialmente, diferenciar a expressao (6.5) com respeito a 0o e Pi e, em seguida, 
igualar a zero as expressoes resultantes. Feito isso, e apos algumas operagoes algebricas, 
os estimadores resultantes sao: 

Po = y - Pix 

n 

ViXi - nyx 

A = ^ , 

E 2 -2 

— nx 

i= 1 

em que yea media amostral dos yi* s eia media amostral dos Xi s. Logo, 

E(Y | x) = 0o + 0\x (6.6) 

e o modelo de regressao linear simples ajustado, em que E(Y \ x), denotado tambern Y 
por simplicidade, e o valor medio predito de Y para qualquer valor X = x que esteja na 
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variagao observada de X. No exemplo 6.2, a variagao de X se encontra entre 20 e 40 anos 
e as estimativas dos parametros resultaram em (3q = 80,5 e j3\ = 0,9. 

Os desvios e* = Vi — Vi (i = 1 ■ ■ ■ n) sao denominados residuos e sao considerados 
uma amostra aleatoria dos erros. Por este fato, uma analise grafica dos residuos e, em 
geral, realizada para verificar as suposigoes assumidas para os erros e*. 

6.3.2 Adequagao do modelo de regressao linear ajustado 

Apos ajustar o modelo de regressao linear simples devemos, antes de adota-lo defi- 
nitivamente para fazer predigoes (interpolagoes) , verificar: 

1. se o modelo se ajusta bem aos dados e, 

2. se as suposigoes basicas se encontram satisfeitas. 

Quanto a qualidade de ajuste do modelo, podemos fazer uso do coeficiente de deter- 
minagao, R 2 , que nos fornece a porcentagem da variagao total de Y explicada pelo modelo, 
ou seja, o percentual da variabilidade da variavel dependente Y explicada pela variavel 
independente X. Em regressao linear simples esse coeficiente pode ser obtido por R 2 = r 2 , 
em que re o coeficiente de correlagao de Pearson amostral. O coeficiente de determinagao 
varia de 0 a 1 (ou 0 a 100%), sendo que quanto rnais proximo de 1 (100%), melhor o ajuste 
do modelo considerado. 

Podemos, tambem, obter o coeficiente de determinagao R 2 a partir da analise de 
variancia da regressao, em que a variagao total de Y e decomposta como mostrado no 
Quadro I. Fazendo-se uso da decomposigao apresentada, temos que R 2 = SQ Reg / SQTotai- 


Quadro I: Analise de Variancia (ANOVA) da Regressao. 


Fonte de Variagao 

g-1- 

Soma de Quadrados 

Quadrado Medio 

Regressao 

P~ 1 

n 

SQReg ='52(Vi- V) 2 

i—1 

QMReg = 

Residuos 

n — p 

n 

SQ Res = - Vi) 2 

i= 1 

QMRes = 

Total 

n — 1 

n 

SQTotal — ^ "'jiVi U ) 

i= 1 



p = niimero de parametros do modelo e n = tamanho amostral. 


Para testarmos a significancia do parametro (3\, o que, na pratica, significa verificar 
se a covariavel X influencia a resposta Y, testamos as hipoteses Hq : /3i = 0 contra Hq: 
j3\ / 0. A estatfstica de teste utilizada para esta finalidade e dada por: 

_ QM Reg 
QXlRes ’ 

em que QM Reg e QM Res sao, respectivamente, os quadrados rnedios da regressao e dos 
residuos apresentados no Quadro I. Sob Hq, tal estatfstica tern distribuigao F de Snedecor 
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com p — l e n — p graus de liberdade. Assim, rejeitamos Hq se o valor calculado de F for 
rnaior que o valor de F tabelado a um nrvel a de significancia pre-estabelecido. 

O Quadro II apresenta a ANOVA para os dados da Tabela 6.1. A partir desse quadro, 
temos que R 2 = 0, 589, o que nos indica que 58,9% da variagao total do tempo de reagao 
esta sendo explicada pela idade. Podemos tambem concluir pela rejeigao de Hq\ [R = 0 
ao nrvel de significancia de 5%, visto que F = 25,897 > ^ 06 ( 1 , 1 . 8 , 5 %) = 4,41. Concluimos, 
assim, que a covariavel idade realmente influencia o tempo de reagao. 


Quadro II: Analise de Variancia da Regressao - Dados Tabela 6.1. 


Fonte de Variagao 

g-1. 

Soma de Quadrados 

Quadrado Medio 

F 

Regressao 

1 

SQReg = 810 

QMReg = 810 

25,897 

Resfduos 

18 

SQRes = 563 

QMR es = 31, 28 


Total 

19 

SQrotai = 1373 




Quanto as suposigoes, devemos verificar se os erros encontram-se aleatoriamente 
distribuidos em torno de zero, bem como se a variancia dos mesmos e constante e se 
sao independentes. A suposigao de independencia esta intimamente relacionada a forma 
como os dados forarn coletados. Se o experimento foi conduzido de forma a garantir que as 
informagbes observadas em uma unidade amostral nao tenham sido influenciadas pelas das 
outras unidades, entao esta suposigao e razoavel. Por outro lado, o grafico dos resfduos, 
ej, versus os valores preditos pelo modelo, y j, bem como o grafico dos resfduos versus os 
valores Xi, nos auxiliam a verificar se a media dos erros e zero e se a variancia e constante. 
Para os dados do exemplo 6.2, a Figura 6.3 mostra ambos os graficos. 

(a) 


5 10 15 20 20 25 30 35 40 

preditos preditos 

Figura 6.3: Analise grafica dos resfduos associados ao modelo ajustado. 

Note, a partir do grafico (a) mostrado na Figura 6.3, que os resfduos encontram- 
se distribuidos aleatoriamente em torno de zero, indicando que a media dos mesmos se 
encontra proxima de zero. No grafico (b), desta mesma figura, podemos observar que os 
resfduos, em x = 20, 25, 30, 35 e 40, apresentam variabilidades semelhantes, indicando- 
nos que a variancia dos erros pode ser considerada constante. Para verificar a suposigao 
de que os erros seguem a distribuigao Normal, um grafico dos quantis teoricos versus os 
quantis amostrais dos resfduos, conhecido por QQplot, deve apresentar um comportamento 
proximo do linear. Para os dados do exemplo da idade e tempo de reagao, obtivemos o 




110 


Correlagao e Regressao Linear 


Giolo, S. R. 


QQplot apresentado na Figura 6.4. A partir desta figura, notamos que a suposigao de 
normalidade dos erros, e conseqiientemente da variavel resposta Y , e razoavel para os 
dados desse exemplo. 


Normal Q-Q Plot 



- 2-10 1 2 
Quantis teoricos 


Figura 6.4: QQplot dos resi'duos. 


6.3.3 Interpretagao dos parametros do modelo 

Se o modelo de regressao linear simples (MRLS) for considerado adequado para 
descrever a relagao linear entre Y e X, os coeficientes (3q e (5\ sao interpretados do seguinte 
rnodo: 

i) se a variagao dos dados em X incluir x = 0, entao o intercepto (3q e a resposta 

esperada (media) em x = 0. Caso contrario, (3q nao apresenta interpretagao pratica; 

ii ) o parametro e interpretado como a mudanga no valor esperado de Y produzido 

por uma unidade de mudanga em X. 

Para os dados do exemplo apresentado na Tabela 6.1, o modelo de regressao linear 
simples ajustado e dado por: 

eJy]~x) = 80, 5 + 0, 9 x. 

Como a variagao dos dados em X nao inclui x = 0, nao ha interpretagao pratica do 
coeficiente = 80, 5. Por outro lado, = 0, 9 significa que a cada aumento de 1 ano 
na idade das pessoas, o tempo esperado de reagao aumenta, em media, 0, 9 segundos. Por 
exemplo, de 20 para 21 anos, estimamos um aumento no tempo de reagao de, em media, 
0,9 segundos. 

Na Figura 6.5, apresentamos os tempos de reagao registrados para as idades obser- 
vadas, bem como os tempos rnedios de reagao em cada uma dessas idades. O modelo de 
regressao linear simples ajustado, que podemos visualizar nesta mesma figura, apresenta 
um ajuste satisfatorio aos tempos esperados de reagao em fungao da idade. 

De acordo com o modelo ajustado, estimamos, portanto, que o tempo de reagao ao 
estimulo de pessoas com idade igual a 20 anos, seja de, em media, y = 80,5 + (0,9) (20) = 
98,5 segundos. Esse mesrno tempo para pessoas com 25 anos de idade e esperado ser, em 
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Figura 6.5: Tempos de reagao em fungao da idade e MRLS ajustado. 


media, 103 segundos. Estimativas para qualquer outra idade entre 20 e 40 anos podem 
ser obtidas de forma analoga. 

As estimativas pontuais, y, obtidas por meio do rnodelo de regressao linear simples 
ajustado, claramente nao refletem a variagao que certamente ocorre entre pessoas de uma 
mesrna idade. Uma estimativa intervalar do tempo esperado de reagao seria, desse modo, 
conveniente e recomendavel. Este intervalo para uma idade X = x, a urn nivel de confianga 
de (1 — ot)%, pode ser obtido por: 

y ± ia/2,n-2V / ^(y) 

sendo t a / 2, n -2 ° quantil a/2 da distribuigao f-Student com (n — 2) graus de liberdade, n 
o tamanho amostral e var(y), a variancia de y a qual e estimada por: 

1 (x — x ) 2 
» + Etaite-*) 2 . 

em que: 

3 & -in ) 2 

(n — 2) ' 

Assim, se considerarmos pessoas com idade igual a x = 28 anos, estimamos que o 
tempo de reagao delas seja de, em media, 105,7 segundos. Este tempo medio de reagao, a 
urn nivel de confianga de 95%, pode variar entre 102,98 e 108,42 segundos. 



Capitulo 7 


Analise de Variancia 


7.1 Introducao 

A Analise de Variancia (ANOVA) e um procedimento utilizado para comparar tres 
on rnais tratamentos. Existem muitas variagbes da ANOVA devido aos diferentes tipos 
de experimentos que podern ser realizados. Nesse curso sera estudado apenas a analise de 
variancia com um fator. 

Inicialmente, sao apresentados alguns conceitos utilizados em planejamento de ex- 
perimentos e na analise de variancia. 


7.2 Conceitos Basicos sobre Experimentacao 

7.2.1 Tratamento 

Um tratamento e uma condigao imposta ou objeto que se deseja rnedir ou avaliar em 
um experimento. Normalmente, em um experimento, e utilizado rnais de um tratamento. 
Como exemplos de tratamentos, podem-se citar: equipamentos de diferentes marcas, dife- 
rentes tamanhos de pegas, doses de um nutriente em um meio de cultura, quantidade de 
lubrificante em uma maquina, temperatura de armazenamento de um alimento. 

Os tratamentos que podem ser dispostos em uma ordem, como por exemplo, doses 
de nutrientes, quantidade de lubrificante, nfveis de temperatura, sao ditos tratamentos 
quantitativos. Ja os tratamentos que nao podem ser dispostos numa ordem, sao ditos 
tratamentos qualitativos , por exemplo, variedades de plantas, metodos de preparagao de 
alimento, marcas de equipamentos e outros. 

Cada tipo de tratamento tambem pode ser chamado de um fator. Nesse texto, serao 
estudados somente experimentos com um fator de interesse. 

O tipo de tratamento tern importancia na forma como os dados serao analisados. 
Quando os tratamentos sao quantitativos, pode-se usar, por exemplo, tecnicas de analise 
de regressao. 
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Os tratamentos sao chamados de variaveis independentes. Quando, em um experi- 
mento, estamos interessados em estudar apenas um tipo de variavel independente, dizemos 
que possui'mos apenas um fator. Em um experimento, um fator pode ter varias categoriais 
que sao chamadas de mveis. 

Exemplo: Um laboratorio deseja estudar o efeito da composigao de pegas de metal 
sobre a dilatagao. 

Neste exemplo, a composigao das pegas e o fator (variavel independente). Os di- 
ferentes tipos de composigao sao os mveis do fator. A dilatagao das pegas, medida em 
milfmetros, por exemplo, e a variavel resposta (variavel dependente). 

Em um experimento podem existir rnais de um fator e mais de uma variavel resposta. 

Toda e qualquer variavel que possa interferir na variavel resposta ou dependente 
deve ser mantida constante. Quando isso nao e possfvel, existem tecnicas (estrategias) 
que podem ser utilizadas para reduzir ou eliminar essa interferencia. 

7.2.2 Unidade experimental ou parcela 


Unidade experimental ou parcela e onde e feita a aplicagao do tratamento. E a 
unidade experimental que fornece os dados para serern avaliados. Como exemplos de 
unidades experimentais ou parcelas pode-se citar: um motor, uma pega do motor, uma 
placa de Petri com meio de cultura, uma porgao de algurn alimento. 

As unidades experimentais podem ser formadas por grupos ou individuos. Por exem- 
plo, quando trabalha-se com cobaias, pode-se ter apenas uma cobaia como unidade experi- 
mental, ou seja, apenas um animal fornecera a resposta do tratamento, ou ainda, pode-se 
ter um grupo de cobaias em uma gaiola fornecendo as informagoes. O uso de grupos 
ou individuos como unidades experimentais depende do fenomeno que se esta estudando, 
da forma como o experimento e conduzido e dos recursos dispomveis. De modo geral, a 
escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental. 

7.2.3 Repetigao 


Repetigao e o numero de vezes que um tratamento aparece no experimento. 

O numero de repetigdes, em um experimento, vai depender tambem dos recursos 
dispomveis, do tipo de experimento (delineamento) e, tambem, da variabilidade do ex- 
perimento ou da variavel resposta. Existem varias metodologias para estimar o numero 
satisfatorio de repetigoes em um experimento. Mas, em fungao das possfveis limitagoes 
acirna, a definigao do numero de repetigoes, muitas vezes, torna-se uma tarefa dificil. A 
experiencia do pesquisador sobre o fenomeno em estudo deve ser levada em considera- 
gao. Alem disso, as metodologias empregadas, para esse calculo, pressupoem que uma 
estimativa do erro experimental e conhecida. Nem sernpre essa informagao esta disponivel 
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antes da realizagao de urn experimento e, como cada experimento e uma nova historia, em 
fungao de caracterfsticas intrfnsecas de cada fenomeno, esse calculo pode ser em vao. 

7.2.4 Variavel resposta ou variavel dependente 

Uma variavel e qualquer caracterfstica que apresenta variagao, por exemplo, a altura 
de pessoas, o peso de animais, o comprimento de uma pega, o numero de microrganismos 
em um litro de leite etc. 

Quando o valor de uma variavel nao pode ser determinado antes da realizagao de 
um experimento, tem-se entao uma variavel aleatoria. 

As variaveis que assumem valores enumeraveis, sao denominadas variaveis aleatorias 
discretas. Por exemplo, o numero de sementes germinadas, o numero de microrganismos 
em um litro de leite. 

As variaveis que assumem valores em um intervalo, sao denominadas variaveis ale- 
atorias contmuas. Por exemplo, o peso de animais, o teor de umidade em um alimento, o 
conteudo de oleo em uma semente. 

Em um experimento, podem ser medidas muitas variaveis, mas deve-se considerar 
somente aquelas que possarn contribuir para a explicagao da hipotese formulada. 

E o pesquisador, em geral, quern sabe quais serao as variaveis que serao medidas 
em um experimento. Ele deve ser alertado, sernpre, sobre as condigoes para a realizagao 
de tais medigoes, no sentido de evitar gastar recursos com variaveis que nao fornecerao as 
informagSes para se testar a(s) hipotese(s). Quando o volume de dados de um experimento 
torna-se grande, aumentam os riscos de erros grosseiros, como de registro, de inversao de 
variaveis etc. 

7.2.5 Delineamento experimental (Design) 

Com a finalidade de reduzir o erro experimental, existem os chamados delineamentos 
experimentais. Um delineamento experimental e a forma como os tratamentos ou niveis 
de um fator sao designados as unidades experimentais ou parcelas. A analise de variancia 
(que sera vista mais adiante) e baseada no delineamento experimental utilizado. 

Por isso, saber como o experimento foi instalado e conduzido, e de fundamental 
importancia. Pequenas modificagoes podem acarretar em grandes mudangas na forma da 
analise estatfstica. Nao raro, acontecem situagoes em que as hipoteses formuladas, a priori, 
nao podem ser testadas, ou ainda, e impossivel de se realizar uma analise estatfstica. Por 
isso, deve-se dar muita importancia ao planejamento experimental. 

Um delineamento experimental e planejado de tal forma que a variagao ao acaso 
seja reduzida o maximo possfvel. Alguns dos principais delineamentos experimentais sao: 
delineamento completamente casualizado (DCC), delineamento em blocos casualizados 
(DBC) e quadrado latino. 
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7.2.6 Modelo e analise de variancia 

Em um experimento completamente casualizado, cada observagao Yjj pode ser de- 
composta conforme o modelo a seguir: 

Yij = fj, + Ti + eij i = 1, . . . ,1 e j = 1, . . . , J (7.1) 

em que: 

Yij e a observagao do i-esimo tratamento na j-esima unidade experimental ou parcela; 
p e o efeito constante (media geral); 

Ti e o efeito do i-esimo tratamento; 

e o erro associado ao i-esimo tratamento na j-esima unidade experimental ou parcela 
assumido como: I ^ ) N( 0, a 2 ). Aqui, IID significa que os erros devem ser independentes 

e identicamente distribuidos. 

Em um experimento, existe o interesse em testar se ha diferengas entre as rnedias 
dos tratamentos, o que equivale a testar as hipoteses: 

j H 0 : pi = p2 = ■■■ = pi 

I H\ : pi / pi> para pelo menos um par com i ^ i! 

em que: 

Pi = p + Ti i = 1,2, . . . , I. 

De forma equivalente, podemos escrever tais hipoteses da seguinte forma: 

j H 0 : n = r 2 = • • • = r 7 = 0 

I Hi : Ti / 0 para pelo menos um i . 

Note que, se a hipotese nula for verdadeira, todos os tratamentos terao uma media 
comum p. 

A analise de variancia, baseia-se na decomposigao da variagao total da variavel 

resposta em partes que podem ser atribufdas aos tratamentos (variancia entre) e ao erro 

experimental (variancia dentro). Essa variagao pode ser medida por meio das somas de 

quadrados definidas para cada um dos seguintes componentes: 

i j (E E Vij) 2 

SQTotal = Vij ~ C, em que C = i-iJ Jj , 

i=lj=l 

I 

J2 yl 

SQTrat = C. 

e a soma de quadrados dos residuos pode ser obtida por diferenga: 

SQRes = SQTotal - SQTrat. 

A SQTrat tambem e chamada de variagao Entre, que e a variagao existente entre 
os diferentes tratamentos e a SQRes e chamada de variagao Dentro que e fungao das 
diferengas existentes entre as repetigoes de um mesmo tratamento. 
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Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela 
da analise de variancia, como apresentado na Tabela 7.1. 

Para testar a hipotese Hq, utiliza-se o teste F apresentado na tabela da Analise 
de Variancia (Tabela 7.1). Convem lembrar que esse teste e valido se os pressupostos 
assumidos para os erros do modelo estiverem satisfeitos. 


Tabela 7.1: Tabela da analise de variancia. 


Causas de 
Variagao 

Graus de 
Liberdade 

Soma de 
Quadrados 

Quadrados 

Medios 

F calculado 

Tratamentos 

Resfduo 

1-1 

I(J-l) 

SQTrat 

SQRes 

QMTrat 

QMRes 

QMTrat / QMRes 

Total 

IJ-1 

SQTotal 




em que QMTrat=SQTrat/(I-l) e QMRes=SQRes/(I(J-l)). 

Pode-se mostrar que o quociente QMTrat/QMRes tem distribuigao F com (/ — 1) 
e I(J — 1) graus de liberdade, supondo que y t j sejarn variaveis aleatorias independentes, 
todos os tratamentos tem variancias iguais a a 2 e Yij ~ N(ni,o 2 ). Por esses motivos, os 
pressupostos da ANOVA devem ser testados ou avaliados em qualquer analise. 

Se F calculado>Ftabelado, rejeitamos a hipotese de nulidade Hq, ou seja, existem 
evidencias de diferenga significativa entre pelo menos um par de medias de tratamentos, 
ao nivel a de significancia escolhido. Caso contrario, nao rejeita-se a hipotese de nulidade 
Hq, ou seja, nao ha evidencias de diferenga significativa entre tratamentos, ao nfvel a de 
significancia escolhido. 

Outra maneira de avaliar a significancia da estatfstica F e utilizando o p-valor. Se 
o p-valor< a, rejeitamos a hipotese de nulidade Hq. Caso contrario, nao se rejeitamos a 
hipotese de nulidade Hq, ou seja, nao ha evidencias de diferengas significativas entre os 
tratamentos, ao nfvel a de significancia escolhido. 

7.2.7 Delineamento experimental 

Quando as unidades experimentais sao homogeneas, ou seja, as parcelas sao uni- 
forrnes, os tratamentos podem ser sorteados nas unidades experimentais sem qualquer 
restrigao. Nessa situagao, o delineamento experimental e chamado de delineamento com- 
pletamente casualizado (DCC). Neste caso, todos os tratamentos tem a mesrna chance de 
serern aplicados em qualquer unidade experimental ou parcela. Nesse texto, abordaremos 
apenas esse tipo de delineamento que e o caso mais simples da ANOVA. 

7.3 Analise de Variancia 

Exemplo 7.1. Considere o seguinte experimento que foi conduzido, considerando um de- 
lineamento inteiramente casualizado. Forarn comparados 4 tratamentos (tipos de cultivo: 
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Agar (A), Cassia (C), Guar (G), Leucena (L)). Mediu-se o crescimento, em gramas, de 
explantes de morango (Tabela 7.2). 


Tabela 7.2: Crescimento de explantes de morangos em gramas. 


Trat. 

i 

II 

III 

Repetigoes 
IV V 

VI 

VII 

VIII 

Total 

A 

0.1958 

0.1301 

0.1806 

0.1545 

0.1252 

0.1882 

0.2211 

0.1734 

1,3689 

G 

0.3627 

0.4841 

0.4119 

0.4457 

0.4755 

0.5174 

0.4173 

0.4001 

3,5147 

L 

0.1621 

0.1150 

0.2011 

0.2123 

0.1475 

0.1922 

0.1802 

0.2248 

1,4352 

C 

0.2841 

0.3099 

0.2922 

0.1505 

0.2345 

0.1652 

0.1379 

0.1960 

1,7703 

Total 


8,0891 


Para este experimento, consideramos o modelo: 

Uij = n + Ti + eij em que e»j N{ 0, a I 2 ) 

i = 1, 2, . . . , 4 tratamentos; 
j = 1,2, ... ,8 repetigoes; 

Uij e o peso em gramas correspondente ao i-esimo tratamento na j-esima unidade experi- 
mental; 

Ti e o efeito do i-esimo tratamento; 

e o erro experimental associado ao i-esimo tratamento e a j-esima repetigao. 

As hipoteses testadas neste experimento sao: 


Ho ■ n = r 2 = r 3 = r 4 

Hi : Ti / Tj/ para pelo rnenos um par, com i ^ i . 


Calculos para a Analise de Variancia 

Tern-se que: 

I J 

E E Vij = 1958 + 0, 1301 + . . . + 0.1960 = 8, 0891. 

i=lj=l 

I J 

E E Vii = 0> 1958 2 + 0, 1301 2 + . . . + 0.1960 2 = 2, 4952. 
*=1.7=1 

Graus de liberdade de tratamentos= I — 1 = 4— 1 = 3. 
Graus de liberdade do residuo= I(J — 1) = 4(8 — 1) = 28. 
Graus de liberdade total= / J— 1=4x8 — 1 = 31. 

As somas de quadrados sao obtidas da seguinte forma: 


1. SQTotal= ^ ^ y 2 - - 
*=i i=i 


(E E vij) 2 

*=1 3=1 
IJ 


= 2,4952 - (8 ’°3 2 91)2 


0, 4504 
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(E Ew ) 2 

Obs: A expressao J / y e referenciada em alguns textos como fator de corregao 

da soma de quadrados. 


2. 

3. 


E vl 

SQTrat= — 


(E £vy) 2 

i=ij=i 

ij 


1,3689 2 +1,7703 2 +3,5147 2 +1,4352 2 
8 


A Soma de Quadrados dos residuos e obtida por diferenga: 
SQRes=SQTotal-SQTrat= 0, 4504 - 0, 3828 = 0, 0676. 


(8,0891) 2 

32 


0,3828. 


Os quadrados medios sao obtidos pela divisao da soma de quadrados, pelos seus respectivos 
graus de Liberdade. Assim, 

QMTrat=SQTrat/(I-l)=0, 3828/3=0, 1276 e 
QMRes=SQRes/I(J-l)=0, 0676/28=0, 002414. 

O teste F e o quociente entre o QMTrat e o QMRes. Logo, 
Fcalculado=QMTVat/QMRes=0, 1276/0, 002414= 52,8583. 

O Fcalculado e comparado com o Ftabelado, com 3 e 28 graus de liberdade, na tabela de 
F (Tabela ): 

Ftabelado a 1%=2,95 
Ftabelado a 5%=4,57. 

Efetuados os calculos, podemos resumi-los na tabela da analise de variancia apre- 
sentada a seguir: 


Tabela 7.3: Analise de variancia do exemplo 7.1. 


Causas de 

GL 

Soma de 

Quadrados F calculado 

Variagao 


Quadrados 

Medios 

Tratamentos 

4-1=3 

0,3828 

0,1276 52,8583** 

Residuo 

4(8-l)=28 

0,0676 

0,002414 

Total 

4x8-1=31 

0,4504 



** Significative) ao nivel de 1 % de probabilidade 

Conclusao da analise de variancia: de acordo com o teste F, foram encontradas evi- 
dences de diferengas significativas, ao nivel de 1% de probabilidade, entre os tratamentos, 
com relagao ao crescimento. Rejeitamos, portanto, a hipotese de nulidade Hq. Deve exis- 
tir, pelo rnenos, um contraste significativo entre as medias de tratamentos, com relagao ao 
crescimento medio. 

O procedimento seguinte, quando de interesse do pesquisador, e o de comparar as 
medias de tratamentos utilizando algum teste de comparagao de medias ou contrastes para 
identificar qual ou quais tratamentos e ou sao diferente(s). 


7.4 Teste de Tukey para Comparacao de Medias 


7.4. Teste de Tukey para Comparagao de Medias 
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Apos concluirmos que existe diferenga significativa entre tratamentos, por meio do 
teste F, podemos estar interessados em avaliar a magnitude destas diferengas utilizando 
um teste de comparagoes multiplas. Sera utilizado o teste de Tukey. 

O teste de Tukey permite testar qualquer contraste, sempre, entre duas medias de 
tratamentos, ou seja, nao permite comparar grupos entre si. 

O teste baseia-se na Diferenga Minima Significativa (DMS) A. A estatistica do teste 
e dada da seguinte forma: 


A - (7.2) 

em que q e a amplitude total studentizada, tabelada (tabela 7), QMRes e o quadrado medio 
do residuo, ere o numero de repetigoes. O valor de q depende do numero de tratamentos 
e do numero de graus de liberdade do residuo. Tambem, em um teste de comparagoes 
de medias, deve-se determinar um nivel de significancia a para o teste. Normalmente, 
utiliza-se o nivel de 5% ou 1% de significancia. 

Como o teste de Tukey e, de certa forma, independente do teste F, e possivel que, 
rnesrno sendo significativo o valor de F calculado, nao se encontrem diferengas significativas 
entre contrastes de medias. 

Aplicando o teste de Tukey as medias dos tratamentos do exemplo 7.1, ternos: 

/ 0,00242 

A(5%) = 3, 85 v — ^ = 0, 06696. 

sendo 

q=3,85 e a = 0, 05 

Se o contraste for maior do que A, entao as medias diferem ao nivel a de significancia. 
Utilizar-se-a o metodo de letras para exemplificar o uso do teste, mas existem outras 
maneiras de representagao como, por exemplo, o uso de tabelas ou barras. 

Inicialmente, ordenamos as medias de forma crescente ou decrescente, para facilitar 
as comparagoes. Colocamos uma letra do alfabeto na primeira media (normalmente a 
letra ‘a’) e, em seguida, comparamos a diferenga com as medias seguintes. Se a diferenga 
for superior ao valor de A(5%) = 0,06696, a diferenga entre duas medias sera considerada 
significativa. Sendo representada pela presenga de letras diferentes. O resultado final e o 
seguinte: 

G 0,4393 a 

C 0,2213 b 

L 0,1794 b 

A 0,1711 b 


Temos que, medias de crescimento seguidas de letras iguais, nao diferem significati- 
vamente entre si, pelo teste de Tukey, ao nivel de 5% de probabilidade. 
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7.5 Teste de Kruskal- Wallis 


A analise de variancia exige que os erros tenharn distribuigao Normal e deve haver 
homocedasticidade entre os tratamentos (variancias homogeneas). Estes pressupostos nem 
sernpre sao satisfeitos em urn experimento ou conjunto de dados. 

Como uma alternativa para a analise de variancia parametrica para um delineamento 
completamente casualizado, k > 3 tratamentos, existe o teste nao parametrico de Kruskal- 
Wallis. Este teste pode ser utilizado para testar a hipotese Hq : ti = 72 = ■ • • = Tfc. No 
lugar das medidas, utiliza-se os postos e nao ha suposigbes com relagao a Normalidade e 
Homocedasticidade. 

Uma exigencia do teste de Kruskal- Wallis e que a variavel em estudo seja continua. 
Outra e que as observagoes devem ser independentes. A analise consiste em obter o posto 
de cada uma das observagoes. Adota-se que o menor valor recebe (ranking ou posto) 1, 
o segundo 2 e assim por diante, ate que todas as observagoes tenharn sido consideradas. 
Quando ocorrerem empates, atribui-se o valor medio entre as observagoes, ou seja, atribui- 
se a media das ordens que seriam atribuidas a elas se nao ocorresse o ernpate. Se, por 
exemplo, as duas menores observagoes forem iguais ha um ernpate. Neste caso, cada uma 
recebe o posto 1,5 que e a media dos valores 1 e 2. 

Para testar a hipotese nula, utilizamos a estatistica de teste: 


H = 


i2 a m 2 

N(N + 1) rij 


3(N + 1) 


em que: 

N = nurnero total de observagbes; 
k = numero de tratamentos; 

rij = numero de observagoes no j-esimo tratamento; 

Rj = soma dos postos do j-esimo tratamento. 

Rejeitamos Hq se H> x 2 com k — 1 graus de liberdade ao nivel a de significancia. 
Se ocorrerem empates, a estatistica de teste H deve ser corrigida com a seguinte 
expressao: 


<7 = 1- 


Utl-u) 


N 3 -N ’ 

em que Re o numero de observagoes empatadas no i-esimo grupo. 
Assim, temos a estatistica corrigida: 


Para testar Hq, procedemos exatamente como se nao houvesse empates. 

Exemplo 7.2. Em um experimento para avaliar o consumo de energia eletrica em KWh 
de tres motores durante um hora de funcionamento, obteve-se os seguintes resultados: 
Aplicando-se o teste de Kruskal- Wallis, temos que: 


7.5. Teste de Kruskal-Wallis 
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Tabela 7.4: Consumo de energia eletrica de tres motores durante uma hora. 


Motor 1 

Motor 2 

Motor 3 

2212 (13) 

2195 (12) 

1770 (4) 

2025 (9) 

2031 (11) 

1800 (5) 

1989 (8) 

1876 (7) 

1852 (6) 

2232 (14) 

1750 (2) 

1769 (3) 

2027 (10) 

1060 (1) 


LO 

II 

£ 

II 

CO 

CO 

Ri = 18 


H = 


12 


14(15) 


54 2 33 2 18 2 

— 1 r 1 T~ 

5 5 4 


- 3(15) = 5,4 


O valor x 2 , com A: — 1 = 3 — 1 = 2 graus de liberdade e um nivel de significancia de 
5% e 5,99. portanto, nao rejeitamos Ho, ou seja, nao ha evidencias de que que os motores 
possuem um consumo diferente de energia eletrica. 


Capitulo 8 


Controle Estatistico de Qualidade 


8.1 Introducao 

A analise e interpretagao de dados, voltados para a melhoria da qualidade de pro- 
dutos ou servigos, e chamada de controle estatistico de qualidade ou controle esta- 
tistico de processos (CEP). 

No controle estatistico de qualidade existem varios metodos que podern ser utiliza- 
dos para monitorar urn processo: desde a estatistica descritiva ou um simples grafico de 
dispersao, ate metodos mais especificos corno graficos de controle e indices de capacidade. 
Neste texto, abordaremos apenas alguns tipos de graficos de controle. 


8.1.1 Graficos de controle 

Basicamente, um grafico de controle consiste no acompanhamento de um processo 
ao longo do tempo. Um linha media e inserida no grafico acompanhada de uma linha 
superior e uma linha inferior, chamadas de limite superior e limite inferior de controle, 
respectivamente. Esses limites sao construfdos segundo criterios estatfsticos. Na Figura 

8.1 e mostrado um exemplo de grafico de controle. 

Diz-se que um processo esta sob controle ou estavel quando a variagao observada e 
devida somente a causas de variagao naturals do processo, ou seja, o grafico rnostra apenas 
flutuagdes aleatorias. Caso contrario, o processo e dito fora de controle. 

O objetivo principal de um grafico de controle e identificar se a variagao existente 
e uma fungao de causas naturais de variagao do processo ou de causas especiais. No caso 
de causas especiais, e necessario intervir no processo para reduzir a variabilidade. 

Os graficos de controle sao elaborados em fungao do tipo de variavel e da carac- 
terfstica da amostra. Por exemplo, para atributos ou variaveis do tipo contagem e para 
variaveis continuas sao elaborados graficos para cada tipo de variavel. Tambem, depen- 
dendo do tamanho da amostra (n), metodologias especfficas devem ser utilizadas. 
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Limite superior 


CL) 

CCS 

C\5 


Media 


Limite inferior 


tempo 

Figura 8.1: Grafico de controle: ideia basica. 


8.1.2 Construgao do grafico 

No eixo horizontal sao insei'idos os numeros das amostras de tamanho n (em geral 
constante), observadas no processo. No eixo vertical e inserida a unidade de medida da 
variavel que esta sendo estudada ou controlada. As amostras sao chamadas tambem de 
subgrupos. 

No grafico, sao representadas as medias de cada amostra que irao refletir o compor- 
tamento de variagao do processo. 

A linha central, dependendo das informagoes disponfveis, representa, em geral, a 
media do processo. A linha central ou o valor medio x e obtido pela media das medias 
amostrais e pode, tambem, ser denotada por x. Se existem informagoes anteriores sobre 
o processo, pode-se utilizar um valor de referenda. Por ultimo, se for conhecida, a media 
da populagao, [i deve ser utilizada. 

As duas linhas que definem os limites de controle: LSC - limite superior de controle 
e LIC - limite inferior de controle, sao utilizadas, entre outras, para decidir quando o 
processo esta sob controle ou nao. 

Nao se deve confundir limites de controle com limites de especificagao. Os limites 
de especificagao sao definidos pela natureza do produto. E uma questao tecnica, definida 
pelo projeto do produto. Os limites de controle sao sernpre menores do que os limites 
de especificagao. Os limites de controle, por outro lado, podern ser definidos de duas 
maneiras: 

1. Utilizando a distribuigao da variavel X que mede o desempenho do processo. Nesse 

caso, podemos encontrar limites de controle de tal forma que, 

P(LIC < X < LSC ) > 1 - a 
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sendo a um numero arbitrario e fixo, normalmente pequeno (ct = 0,01). Esse limite 
e chamado de limite probabilistico. Esperamos que, por a ser pequeno, um valor 
alem dos limites inferior e superior devam ocorrer raramente se o processo estiver 
sob controle. Nesse caso, um ponto fora dos limites indicara que o processo esta fora 
de controle e que uma ou rnais causas de variagao especiais estao atuando sobre o 
processo. 

2. Outra maneira e definir os limites de controle por meio de multiplos do desvio padrao 
da variavel X: 


LSC = + ka x 

LIC = [i x — ka x , 

em que e a media de X, a x e o desvio padrao de X e k e uma constante positiva. 

Em geral, costuma-se utilizar k = 3. 

Se X tiver uma distribuigao Normal, a probabilidade de um ponto cair fora dos 
limites e aproximadamente 0,003. 

O tamanho da amostra e o tipo de variavel influenciam na construgao dos limites 
de controle. 

E importante que os limites sejam definidos para um processo que esteja sob controle. 
Ou seja, como os limites dependent da variabilidade do processo (cr), se o processo nao 
estiver sob controle, ou seja, quando a variagao observada e devida somente a causas de 
variagao naturais do processo, os limites podern nao refletir o verdadeiro comportamento 
do processo. 

Limites de aviso ou de alerta 

Podemos utilizar, alem dos limites superior e inferior, limites de aviso. Quando um 
ponto ultrapassa os limites de ±3<r, agoes corretivas devem ser utilizadas. No entanto, um 
limite rnenor, por exemplo, 2a pode ser utilizado como um limite de advertencia (Figura 
8 . 2 ). 

Quando um ponto atinge os limites de aviso, podemos, por exemplo, coletar amostras 
com um n maior e/ou amostras com rnaior freqiiencia, para obter informagoes sobre o 
processo rnais rapidamente. 

Limites de aviso aumentam a sensibilidade do grafico de controle. Por outro lado, 
esses mesmos limites podem gerar alarmes falsos ou falsos positivos. Por isso, eles devem 
ser utilizados com cautela, pois podem, inclusive, aumentar custos sem necessidade. 

8.1.3 Analise do padrao de graficos de controle 

Estabelecidos os limites de controle, devemos analisar e interpretar as informagoes 
fornecidas pelo grafico. 
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tempo 

Figura 8.2: Grafico de controle: limites de aviso. 


Se todos os pontos estiverem dentro dos limites de controle, isso nao indica, neces- 
sariamente, que o processo esteja sob controle. A ausencia de aleatoriedade nos pontos 
pode indicar uma fonte de variagao especial. 

Por exemplo, na Figura 8.3 ha somente 2 pontos abaixo da media e 8 acima. Em 
geral, espera-se uma distribuigao proporcional dos pontos acima e abaixo da media. 


Lj m i to superio r 


CL) 

03 

ca 


Limite inferior 


tempo 

Figura 8.3: Grafico de controle: processo tendencioso. 

Na Figura 8.4 observamos um comportamento efelieo. Nesse caso, o grafico pode 
indicar problemas no processo, como por exemplo, o cansago de operadores. 

Obviamente, quando um ou mais pontos ultrapassam os limites, o processo deve ser 
analisado. Claro que outras regras podern ser adotadas, dependendo do processo do tipo 
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tempo 

Figura 8.4: Grafico de controle: processo ci'clico. 


de variavel, entre outas. 

Algumas regras podem ser (Montgomery, 1991): 

1. um ou mais pontos fora dos limites de controle; 

2. dois de tres pontos consecutivos alem dos limites de 2<r (mas ainda dentro dos limites 
de controle); 

3. quatro de cinco pontos consecutivos alem do limite de hr; 

4. oito pontos consecutivos acirna ou abaixo da linha central; 

5. seis pontos em uma linha crescente ou decrescente; 

6. quinze pontos em linha, acima ou abaixo da media; 

7. quatorze pontos alternados para cirna e para baixo; 

8. oito pontos em linha em arnbos os lados da linha central e nenhum em ate ltr; 

9. um padrao incomum ou nao aleatorio; 

10. um ou mais pontos proximos dos limites de controle. 

Em resumo, um grafico de controle ajuda a: 

• monitorar e reduzir a variabilidade; 

• monitorar um processo ao longo do tempo; 

• detectar rapidamente pontos fora de controle e tendencias; 

• realizar corregoes, diminuindo o numero de produtos defeituosos. 


8.2. Graficos de Controle para Variaveis 
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8.2 Graficos de Controle para Variaveis 

Introdugao 

Quando trabalhamos com variaveis do tipo comprimento, largura, diametro, ou seja, 
variaveis que possuem uma escala continua, sao utilizados graficos de controle para varia- 
veis, que serao apresentados nessa segao. 

No caso de variaveis, existem tres graficos usuais: x, R e s. 

O grafico x e utilizado para monitorar a media do processo, enquanto os graficos R 
e s sao utilizados para monitorar a variabilidade do processo. 

Nos graficos da Figura 8.5, a seguir, pode-se perceber a importancia de se monitorar 
a media e a variancia de um processo. 



Ro 


Figura 8.5: Efeito da media e desvio padrao em relagao aos limites de especificagao (L1E= limite 
inferior de especificagao e LSE= limite superior de especificagao) . 
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Na Figura 8.5(a), o processo comporta-se dentro dos limites de especificagao. Ja, 
nas Figuras 8.5(b) e 8.5(c), existe uma chance maior de produtos serem defeituosos ou 
nao-conformes. 

8.2.1 Graficos de controle para x e R 

Considere uma variavel com distribuigao Normal com media /i e desvio padrao a 
(// e a desconhecidos). Se x\, X 2 , ■ ■ ■ , x n e uma amostra de tamanho n, entao a media da 
amostra e dada por: 


X 1 +X 2 + ■■■+x n 

x = 

n 

sendo x normalmente distribui'do com media fj, e desvio padrao cr s = 

Sabemos, tambem, que, a probabilidade de que alguma media amostral nao pertenga 
ao intervalo /i ± z a / 2 -^ e 1 — a. 

Como visto antes, z a / 2 e geralmente substituido por 3, que significa um limite de 3 
sigmas. 

Em geral, para construgao do grafico de controle sao necessarias mn = 20 a m = 
25 amostras de tamanho n. Normalmente, as amostras tern tamanho pequeno, 4 a 6 
observagoes. 

Sejam agora, xi,X 2 , ■ ■ ■ ,x m as rnedias de cada uma das m amostras, entao, 

X1 + X2 + ■ ■■ + 

X = 

m 

e o melhor estimador da media do processo. Nesse caso, x representa a linha central do 
grafico de controle. 

Os limites de controle podem ser estimados a partir do desvio padrao ou da amplitude 
das m amostras. 

Inicialmente, vamos trabalhar com a amplitude. Se x\, X 2 , ■ ■ ■ , x n e uma amostra de 
tamanho n, a amplitude e a diferenga entre o maior e o menor valor observado na amostra, 
isto e: 


R = x 


max 




Considerando R\, R2, ■ . . , R m , a amplitude das m amostras, entao, 


R _ Rl + Rl + • • • + R m 

m 


e dehnido corno a amplitude media. 

Os limites de controle para o grafico x serao dados por: 
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LSC = x + A 2 R 
Linha central = x 

LIC = x- A 2 R. 


A 2 e uma constante tabelada para diferentes tamanhos de n. Essa constante e deter- 
rninada em fungao da amplitude de variagao e do desvio padrao das amostras, considerando 
uma distribuigao Normal (demonstragao omitida). 

Comentarios sobre o grafico R 

Embora o grafico R tenha sido elaborado inicialmente para facilitar a obtengao 
dos limites de controle, ele e simples de ser constrm'do e interpretado e isso e um ponto 
import ante. 

Para amostras com n pequeno (4, 5, 6 ) a informagao fornecida pela amplitude nao 
e muito diferente daquela fornecida pelo desvio padrao. 

O grafico R e sensfvel a dados discrepantes (outliers). Por isso, e importante analisar 
a origem de um outlier antes de tirar conclusbes sobre o grafico R. Claro que um processo 
que content outliers deve ter problemas. 

8.2.2 Graficos de controle para x e s 

Alem de avaliarmos a variabilidade pela amplitude, e possfvel tambern, utilizar o 
desvio padrao em um grafico de controle. 

Em geral, o grafico de x e s e utilizado quando: 

• n > 10 observagoes por amostra; 

• n e variavel de amostra para amostra. 

Para n > 10, e preferfvel adotar o grafico s em vez do grafico R, pois a precisao sera 
melhor. 

Grafico s 

Para construgao do grafico utilizamos metodos semelhantes aos utilizados nos grafi- 
cos de controle x e R, com modificagoes nas expressoes. 

Para cada amostra, devemos obter a media e o desvio padrao. Uma estimativa da 
variancia amostral pode ser obtida por: 

„2 EILl (Xi-x ) 2 

6 1 
n— 1 

Mas, o desvio padrao amostral de s nao e um estimador nao viesado de a. Consi- 
derando um distribuigao Normal, s estirna C 4 CJ. Aqui, C 4 e uma constante que varia em 


fungao do tamanho amostral n. Ainda, o desvio padrao de s e dado por o\J 1 — c\. 
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Considerando, tambem, que, E(s) = 04 a, a linha central e obtida por C 4 cr. Assim, 
os limites de controle 3 sigmas para s sao obtidos por: 


LSC = C 4 cr + 3 <t yj 1 — c| 

LIC = C 4 C — 3a yj 1 — C 4 . 

Tambem, como nos graficos de controle para x e R, podemos definir constantes. 
Nesse caso, 


B 5 = C 4 - 3yjl — c\ 

Be = c 4 - 3\J 1 — c\ 

Logo, os limites de confianga podern ser reescritos como: 


LSC = B 6 a 
Linha central = C 4 a 
LIC = B 5 a. 

Valores de B§ e Be sao tabelados para varios tamanhos de n. 

Se o valor de a nao e fornecido, ele pode ser estimado de dados anteriores. Consi- 
derando que se tenham m amostras, cada uma com tamanho n, e seja Sj o desvio padrao 
da i-esima amostra, a media dos desvios-padrao e: 


s = 


- m 

m ' 


i = 1 


A estatistica — e um estimador nao viesado de a. 

C 4 


parametros do grafico de controle s: 


Logo, podemos reescrever os 


LSC = s + 3—\/l-cl 


c 4 


Linha central = s 


LIC = s-3- 


c 4 


1 - cl 


Definindo B 3 e B 4 como constantes tal que: 


b 3 = i--Ji -4 

c 4 v 

B4 = 14 \J 1 — c| , 

c 4 V 
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Pode-se reescrever as expressoes do grafico de controle por: 


LSC = B 4 s 

Linha central = s 

LIC = B 3 s. 

Observe, ainda, que, B 4 = Bq/c^ e B 3 = B 5 /C 4 . 

Grafico x 

Utilizando ^ como estimador de a, pode-se definir os limites de controle para o 
grafico x como: 


LSC = x + 


Linha central = x 


LIC = x- 


3 s 


c^yjh 


3 s 

c^y/n 


Definindo-se a constante A 3 = 3/(c4-y/n) tem-se 


LSC = x + ^35 

Linha central = x 

LIC = x — ^35 


8.2.3 Exemplos 

Exemplo 8.1. Considere um conjunto de dados sobre espessura de uma pega de metal 
rnedida em milfmetros (Tabela 8.1). Nesse exemplo, 20 amostras de tamanho n=5 foram 
obtidas. Um grafico de controle para a media para esses dados e apresentado na Figura 
8.6 


Podemos observar no grafico da Figura 8.6 que nao ha pontos localizados alern dos 
limites de controle inferior e superior. Portanto, considerando as regras sugeridas na Segao 
8.1.3 podemos dizer que o processo esta sob controle. 

Alem disso, para os dados da Tabela 8.1, os graficos de controle Res sao apresenta- 
dos nas Figuras 8.7 e 8.8, respectivamente. Nesses graficos, podemos observar que nao ha 
pontos fora dos limites de controle. Seguindo as regras sugeridas na pagina 8.1.3, tambem 
nao ha suspeitas de que o processo esteja fora de controle. 
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Tabela 8.1: Dados de espessura (mm) de uma pega de metal. 


Amostra 

Medidas 


1 

2 

3 

4 

5 

1 

9.88 

10.03 

10.09 

9.96 

9.92 

2 

9.99 

10.02 

9.97 

9.86 

10.03 

3 

9.93 

10.06 

10.01 

10.10 

10.00 

4 

10.00 

10.04 

10.12 

9.99 

10.08 

5 

9.93 

9.99 

9.97 

10.00 

9.99 

6 

9.83 

9.98 

9.94 

10.04 

10.07 

7 

10.11 

9.92 

9.96 

9.99 

9.99 

8 

10.00 

9.96 

10.03 

9.96 

9.97 

9 

9.99 

9.89 

9.97 

9.85 

9.96 

10 

10.06 

10.02 

10.06 

10.01 

10.01 

11 

10.06 

10.03 

9.95 

9.93 

9.94 

12 

10.13 

10.10 

9.87 

9.81 

10.06 

13 

9.98 

10.01 

9.94 

10.11 

9.91 

14 

10.01 

10.04 

10.00 

10.11 

10.03 

15 

10.03 

9.95 

10.23 

9.93 

9.96 

16 

10.09 

9.97 

9.93 

10.02 

10.09 

17 

9.96 

10.02 

10.07 

10.03 

10.14 

18 

9.97 

10.04 

9.96 

9.85 

9.90 

19 

9.93 

10.12 

9.88 

9.81 

9.94 

20 

9.99 

9.92 

9.99 

9.92 

9.95 



Figura 8.6: Grafico de controle para media - sem problemas (Tabela 8.1). 
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Figura 8.7: Grafico de controle para amplitude - dados da Tabela 8.1 



Figura 8.8: Grafico de controle para o desvio padrao - dados da Tabela 8.1. 
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Exemplo 8.2. Consideremos agora, outro conjunto de dados sobre espessura de uma 
peqa de metal, avaliados em outro momento (Tabela 8.2). Nessa situagao, observe que um 
dos pontos amostrais ultrapassa o limite superior de controle (Figura 8.9). Em principio, 
nesse momento deveria ser realizada uma intervengao no processo para descobrir a causa 
do problema. 


Tabela 8.2: Dados de espessura (mm) de uma pega de metal avaliados apos intervengao 
no processo. 


Amostra 

Medidas 


1 

2 

3 

4 

5 

1 

10,18 

9,90 

9,94 

9.97 

9.92 

2 

9.92 

10.06 

9.99 

10,01 

10.18 

3 

10,03 

10.22 

10.18 

10.03 

10.15 

4 

10.04 

9,93 

9.98 

10,40 

10.08 

5 

10,07 

10,06 

10,10 

9,89 

10,10 

6 

10,01 

10,06 

10,05 

9,92 

9,98 

7 

9.93 

10.06 

10.01 

9.99 

9.97 

8 

9,96 

10,08 

9,91 

9.99 

10,03 

9 

10,10 

9.94 

9.98 

9.90 

9.97 

10 

9,97 

10.11 

10.05 

10.01 

10.07 

11 

9,98 

10.00 

10,03 

10,14 

10,06 

12 

10.04 

9,87 

10,03 

10,01 

9,93 

13 

10,01 

10.01 

10,04 

10.06 

10,03 

14 

10.09 

10.06 

10.09 

10.10 

10.06 

15 

10.03 

9.93 

9.95 

9.93 

9.87 

16 

9.89 

9.93 

9.96 

10.00 

10.19 

17 

10.03 

10.00 

10.00 

9.97 

9.94 

18 

9.98 

9.97 

9.98 

9.86 

10.05 

19 

10.13 

9.95 

10.05 

10.02 

10.07 

20 

9.95 

10.09 

9.88 

9.96 

9.99 
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Figura 8.9: Grafico de controle para media - com problemas (Tabela 8.2). 
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Tabela 1: Distribuigao Normal: P(0 < Z < z c ). 


Parte inteira 
e primeira 
decimal de z c 

0 

1 

2 

Segunda decimal de z c 
3 4 5 6 

7 

8 

9 

0,0 

0,0000 

0,0040 

0,0080 

0,0120 

0,0160 

0,0199 

0,0239 

0,0279 

0,0319 

0,0359 

0,1 

0,0398 

0,0438 

0,0478 

0,0517 

0,0557 

0,0596 

0,0636 

0,0675 

0,0714 

0,0753 

0,2 

0,0793 

0,0832 

0,0871 

0,0910 

0,0948 

0,0987 

0,1026 

0,1064 

0,1103 

0,1141 

0,3 

0,1179 

0,1217 

0,1255 

0,1293 

0,1331 

0,1368 

0,1406 

0,1443 

0,1480 

0,1517 

0,4 

0,1554 

0,1591 

0,1628 

0,1664 

0,1700 

0,1736 

0,1772 

0,1808 

0,1844 

0,1879 

0,5 

0,1915 

0,1950 

0,1985 

0,2019 

0,2054 

0,2088 

0,2123 

0,2157 

0,2190 

0,2224 

0,6 

0,2257 

0,2291 

0,2324 

0,2357 

0,2389 

0,2422 

0,2454 

0,2486 

0,2517 

0,2549 

0,7 

0,2580 

0,2611 

0,2642 

0,2673 

0,2704 

0,2734 

0,2764 

0,2794 

0,2823 

0,2852 

0,8 

0,2881 

0,2910 

0,2939 

0,2967 

0,2995 

0,3023 

0,3051 

0,3078 

0,3106 

0,3133 

0,9 

0,3159 

0,3186 

0,3212 

0,3238 

0,3264 

0,3289 

0,3315 

0,3340 

0,3365 

0,3389 

1,0 

0,3413 

0,3438 

0,3461 

0,3485 

0,3508 

0,3531 

0,3554 

0,3577 

0,3599 

0,3621 

1,1 

0,3643 

0,3665 

0,3686 

0,3708 

0,3729 

0,3749 

0,3770 

0,3790 

0,3810 

0,3830 

1,2 

0,3849 

0,3869 

0,3888 

0,3907 

0,3925 

0,3944 

0,3962 

0,3980 

0,3997 

0,4015 

1,3 

0,4032 

0,4049 

0,4066 

0,4082 

0,4099 

0,4115 

0,4131 

0,4147 

0,4162 

0,4177 

1,4 

0,4192 

0,4207 

0,4222 

0,4236 

0,4251 

0,4265 

0,4279 

0,4292 

0,4306 

0,4319 

1,5 

0,4332 

0,4345 

0,4357 

0,4370 

0,4382 

0,4394 

0,4406 

0,4418 

0,4429 

0,4441 

1,6 

0,4452 

0,4463 

0,4474 

0,4484 

0,4495 

0,4505 

0,4515 

0,4525 

0,4535 

0,4545 

1,7 

0,4554 

0,4564 

0,4573 

0,4582 

0,4591 

0,4599 

0,4608 

0,4616 

0,4625 

0,4633 

1,8 

0,4641 

0,4649 

0,4656 

0,4664 

0,4671 

0,4678 

0,4686 

0,4693 

0,4699 

0,4706 

1,9 

0,4713 

0,4719 

0,4726 

0,4732 

0,4738 

0,4744 

0,4750 

0,4756 

0,4761 

0,4767 

2,0 

0,4772 

0,4778 

0,4783 

0,4788 

0,4793 

0,4798 

0,4803 

0,4808 

0,4812 

0,4817 

2,1 

0,4821 

0,4826 

0,4830 

0,4834 

0,4838 

0,4842 

0,4846 

0,4850 

0,4854 

0,4857 

2,2 

0,4861 

0,4864 

0,4868 

0,4871 

0,4875 

0,4878 

0,4881 

0,4884 

0,4887 

0,4890 

2,3 

0,4893 

0,4896 

0,4898 

0,4901 

0,4904 

0,4906 

0,4909 

0,4911 

0,4913 

0,4916 

2,4 

0,4918 

0,4920 

0,4922 

0,4925 

0,4927 

0,4929 

0,4931 

0,4932 

0,4934 

0,4936 

2,5 

0,4938 

0,4940 

0,4941 

0,4943 

0,4945 

0,4946 

0,4948 

0,4949 

0,4951 

0,4952 

2,6 

0,4953 

0,4955 

0,4956 

0,4957 

0,4959 

0,4960 

0,4961 

0,4962 

0,4963 

0,4964 

2,7 

0,4965 

0,4966 

0,4967 

0,4968 

0,4969 

0,4970 

0,4971 

0,4972 

0,4973 

0,4974 

2,8 

0,4974 

0,4975 

0,4976 

0,4977 

0,4977 

0,4978 

0,4979 

0,4979 

0,4980 

0,4981 

2,9 

0,4981 

0,4982 

0,4982 

0,4983 

0,4984 

0,4984 

0,4985 

0,4985 

0,4986 

0,4986 

3,0 

0,4987 

0,4987 

0,4987 

0,4988 

0,4988 

0,4989 

0,4989 

0,4989 

0,4990 

0,4990 

3,1 

0,4990 

0,4991 

0,4991 

0,4991 

0,4992 

0,4992 

0,4992 

0,4992 

0,4993 

0,4993 

3,2 

0,4993 

0,4993 

0,4994 

0,4994 

0,4994 

0,4994 

0,4994 

0,4995 

0,4995 

0,4995 

3,3 

0,4995 

0,4995 

0,4995 

0,4996 

0,4996 

0,4996 

0,4996 

0,4996 

0,4996 

0,4997 

3,4 

0,4997 

0,4997 

0,4997 

0,4997 

0,4997 

0,4997 

0,4997 

0,4997 

0,4997 

0,4998 

3,5 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

0,4998 

3,6 

0,4998 

0,4998 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

3,7 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

3,8 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

0,4999 

3,9 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 

0,5000 
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Tabela 2: Distribuigao Normal padrao com valores de P [— oo < Z < Z c ]. 


z 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0,0 

0.5000 

0.4960 

0.4920 

0.4880 

0.4840 

0.4801 

0.4761 

0.4721 

0.4681 

0.4641 

- 0,1 

0.4602 

0.4562 

0.4522 

0.4483 

0.4443 

0.4404 

0.4364 

0.4325 

0.4286 

0.4247 

- 0,2 

0.4207 

0.4168 

0.4129 

0.4090 

0.4052 

0.4013 

0.3974 

0.3936 

0.3897 

0.3859 

- 0,3 

0.3821 

0.3783 

0.3745 

0.3707 

0.3669 

0.3632 

0.3594 

0.3557 

0.3520 

0.3483 

- 0,4 

0.3446 

0.3409 

0.3372 

0.3336 

0.3300 

0.3264 

0.3228 

0.3192 

0.3156 

0.3121 

- 0,5 

0.3085 

0.3050 

0.3015 

0.2981 

0.2946 

0.2912 

0.2877 

0.2843 

0.2810 

0.2776 

- 0,6 

0.2743 

0.2709 

0.2676 

0.2643 

0.2611 

0.2578 

0.2546 

0.2514 

0.2483 

0.2451 

- 0,7 

0.2420 

0.2389 

0.2358 

0.2327 

0.2296 

0.2266 

0.2236 

0.2206 

0.2177 

0.2148 

- 0,8 

0.2119 

0.2090 

0.2061 

0.2033 

0.2005 

0.1977 

0.1949 

0.1922 

0.1894 

0.1867 

- 0,9 

0.1841 

0.1814 

0.1788 

0.1762 

0.1736 

0.1711 

0.1685 

0.1660 

0.1635 

0.1611 

- 1,0 

0.1587 

0.1562 

0.1539 

0.1515 

0.1492 

0.1469 

0.1446 

0.1423 

0.1401 

0.1379 

- 1,1 

0.1357 

0.1335 

0.1314 

0.1292 

0.1271 

0.1251 

0.1230 

0.1210 

0.1190 

0.1170 

- 1,2 

0.1151 

0.1131 

0.1112 

0.1093 

0.1075 

0.1056 

0.1038 

0.1020 

0.1003 

0.0985 

- 1,3 

0.0968 

0.0951 

0.0934 

0.0918 

0.0901 

0.0885 

0.0869 

0.0853 

0.0838 

0.0823 

- 1,4 

0.0808 

0.0793 

0.0778 

0.0764 

0.0749 

0.0735 

0.0721 

0.0708 

0.0694 

0.0681 

- 1,5 

0.0668 

0.0655 

0.0643 

0.0630 

0.0618 

0.0606 

0.0594 

0.0582 

0.0571 

0.0559 

- 1,6 

0.0548 

0.0537 

0.0526 

0.0516 

0.0505 

0.0495 

0.0485 

0.0475 

0.0465 

0.0455 

- 1,7 

0.0446 

0.0436 

0.0427 

0.0418 

0.0409 

0.0401 

0.0392 

0.0384 

0.0375 

0.0367 

- 1,8 

0.0359 

0.0351 

0.0344 

0.0336 

0.0329 

0.0322 

0.0314 

0.0307 

0.0301 

0.0294 

- 1,9 

0.0287 

0.0281 

0.0274 

0.0268 

0.0262 

0.0256 

0.0250 

0.0244 

0.0239 

0.0233 

- 2,0 

0.0228 

0.0222 

0.0217 

0.0212 

0.0207 

0.0202 

0.0197 

0.0192 

0.0188 

0.0183 

- 2,1 

0.0179 

0.0174 

0.0170 

0.0166 

0.0162 

0.0158 

0.0154 

0.0150 

0.0146 

0.0143 

- 2,2 

0.0139 

0.0136 

0.0132 

0.0129 

0.0125 

0.0122 

0.0119 

0.0116 

0.0113 

0.0110 

- 2,3 

0.0107 

0.0104 

0.0102 

0.0099 

0.0096 

0.0094 

0.0091 

0.0089 

0.0087 

0.0084 

- 2,4 

0.0082 

0.0080 

0.0078 

0.0075 

0.0073 

0.0071 

0.0069 

0.0068 

0.0066 

0.0064 

- 2,5 

0.0062 

0.0060 

0.0059 

0.0057 

0.0055 

0.0054 

0.0052 

0.0051 

0.0049 

0.0048 

- 2,6 

0.0047 

0.0045 

0.0044 

0.0043 

0.0041 

0.0040 

0.0039 

0.0038 

0.0037 

0.0036 

- 2,7 

0.0035 

0.0034 

0.0033 

0.0032 

0.0031 

0.0030 

0.0029 

0.0028 

0.0027 

0.0026 

- 2,8 

0.0026 

0.0025 

0.0024 

0.0023 

0.0023 

0.0022 

0.0021 

0.0021 

0.0020 

0.0019 

- 2,9 

0.0019 

0.0018 

0.0018 

0.0017 

0.0016 

0.0016 

0.0015 

0.0015 

0.0014 

0.0014 

- 3,0 

0.0013 

0.0013 

0.0013 

0.0012 

0.0012 

0.0011 

0.0011 

0.0011 

0.0010 

0.0010 

- 3,1 

0.0010 

0.0009 

0.0009 

0.0009 

0.0008 

0.0008 

0.0008 

0.0008 

0.0007 

0.0007 

- 3,2 

0.0007 

0.0007 

0.0006 

0.0006 

0.0006 

0.0006 

0.0006 

0.0005 

0.0005 

0.0005 

- 3,3 

0.0005 

0.0005 

0.0005 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0004 

0.0003 

- 3,4 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0003 

0.0002 

- 3,5 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

0.0002 

- 3,6 

0.0002 

0.0002 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

- 3,7 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

- 3,8 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

0.0001 

- 3,9 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 
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Tabela 3: Distribuigao Normal padrao com valores de P[— oo < Z < Z c \ (continuagao) . 


z 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0,0 

0.5000 

0.5040 

0.5080 

0.5120 

0.5160 

0.5199 

0.5239 

0.5279 

0.5319 

0.5359 

0,1 

0.5398 

0.5438 

0.5478 

0.5517 

0.5557 

0.5596 

0.5636 

0.5675 

0.5714 

0.5753 

0,2 

0.5793 

0.5832 

0.5871 

0.5910 

0.5948 

0.5987 

0.6026 

0.6064 

0.6103 

0.6141 

0,3 

0.6179 

0.6217 

0.6255 

0.6293 

0.6331 

0.6368 

0.6406 

0.6443 

0.6480 

0.6517 

0,4 

0.6554 

0.6591 

0.6628 

0.6664 

0.6700 

0.6736 

0.6772 

0.6808 

0.6844 

0.6879 

0,5 

0.6915 

0.6950 

0.6985 

0.7019 

0.7054 

0.7088 

0.7123 

0.7157 

0.7190 

0.7224 

0,6 

0.7257 

0.7291 

0.7324 

0.7357 

0.7389 

0.7422 

0.7454 

0.7486 

0.7517 

0.7549 

0,7 

0.7580 

0.7611 

0.7642 

0.7673 

0.7704 

0.7734 

0.7764 

0.7794 

0.7823 

0.7852 

0,8 

0.7881 

0.7910 

0.7939 

0.7967 

0.7995 

0.8023 

0.8051 

0.8078 

0.8106 

0.8133 

0,9 

0.8159 

0.8186 

0.8212 

0.8238 

0.8264 

0.8289 

0.8315 

0.8340 

0.8365 

0.8389 

1,0 

0.8413 

0.8438 

0.8461 

0.8485 

0.8508 

0.8531 

0.8554 

0.8577 

0.8599 

0.8621 

1,1 

0.8643 

0.8665 

0.8686 

0.8708 

0.8729 

0.8749 

0.8770 

0.8790 

0.8810 

0.8830 

1,2 

0.8849 

0.8869 

0.8888 

0.8907 

0.8925 

0.8944 

0.8962 

0.8980 

0.8997 

0.9015 

1,3 

0.9032 

0.9049 

0.9066 

0.9082 

0.9099 

0.9115 

0.9131 

0.9147 

0.9162 

0.9177 

1,4 

0.9192 

0.9207 

0.9222 

0.9236 

0.9251 

0.9265 

0.9279 

0.9292 

0.9306 

0.9319 

1,5 

0.9332 

0.9345 

0.9357 

0.9370 

0.9382 

0.9394 

0.9406 

0.9418 

0.9429 

0.9441 

1,6 

0.9452 

0.9463 

0.9474 

0.9484 

0.9495 

0.9505 

0.9515 

0.9525 

0.9535 

0.9545 

1,7 

0.9554 

0.9564 

0.9573 

0.9582 

0.9591 

0.9599 

0.9608 

0.9616 

0.9625 

0.9633 

1,8 

0.9641 

0.9649 

0.9656 

0.9664 

0.9671 

0.9678 

0.9686 

0.9693 

0.9699 

0.9706 

1,9 

0.9713 

0.9719 

0.9726 

0.9732 

0.9738 

0.9744 

0.9750 

0.9756 

0.9761 

0.9767 

2,0 

0.9772 

0.9778 

0.9783 

0.9788 

0.9793 

0.9798 

0.9803 

0.9808 

0.9812 

0.9817 

2,1 

0.9821 

0.9826 

0.9830 

0.9834 

0.9838 

0.9842 

0.9846 

0.9850 

0.9854 

0.9857 

2,2 

0.9861 

0.9864 

0.9868 

0.9871 

0.9875 

0.9878 

0.9881 

0.9884 

0.9887 

0.9890 

2,3 

0.9893 

0.9896 

0.9898 

0.9901 

0.9904 

0.9906 

0.9909 

0.9911 

0.9913 

0.9916 

2,4 

0.9918 

0.9920 

0.9922 

0.9925 

0.9927 

0.9929 

0.9931 

0.9932 

0.9934 

0.9936 

2,5 

0.9938 

0.9940 

0.9941 

0.9943 

0.9945 

0.9946 

0.9948 

0.9949 

0.9951 

0.9952 

2,6 

0.9953 

0.9955 

0.9956 

0.9957 

0.9959 

0.9960 

0.9961 

0.9962 

0.9963 

0.9964 

2,7 

0.9965 

0.9966 

0.9967 

0.9968 

0.9969 

0.9970 

0.9971 

0.9972 

0.9973 

0.9974 

2,8 

0.9974 

0.9975 

0.9976 

0.9977 

0.9977 

0.9978 

0.9979 

0.9979 

0.9980 

0.9981 

2,9 

0.9981 

0.9982 

0.9982 

0.9983 

0.9984 

0.9984 

0.9985 

0.9985 

0.9986 

0.9986 

3,0 

0.9987 

0.9987 

0.9987 

0.9988 

0.9988 

0.9989 

0.9989 

0.9989 

0.9990 

0.9990 

3,1 

0.9990 

0.9991 

0.9991 

0.9991 

0.9992 

0.9992 

0.9992 

0.9992 

0.9993 

0.9993 

3,2 

0.9993 

0.9993 

0.9994 

0.9994 

0.9994 

0.9994 

0.9994 

0.9995 

0.9995 

0.9995 

3,3 

0.9995 

0.9995 

0.9995 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9996 

0.9997 

3,4 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9997 

0.9998 

3,5 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

0.9998 

3,6 

0.9998 

0.9998 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

3,7 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

3,8 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

0.9999 

3,9 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 

1.0000 


Tabela 4: Limites unilaterais de F ao mvel de 5% de probabilidade 

nl=numero de graus de liberdade do numerador, n2= numero de graus de liberdade do denominador 


n 2 \nl 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

20 

24 

30 

40 

60 

120 

OO 

1 

161,4 

199,5 

215,7 

224,6 

230,2 

234,0 

236,8 

238,9 

240,5 

241,9 

243,0 

243,9 

244,7 

245,4 

245,9 

246,5 

248,0 

249,1 

250,1 

251,1 

252,2 

253,3 

254,3 

2 

18,51 

19,00 

19,16 

19,25 

19,30 

19,33 

19,35 

19,37 

19,38 

19,40 

19,40 

19,41 

19,42 

19,42 

19,43 

19,43 

19,45 

19,45 

19,46 

19,47 

19,48 

19,49 

19,50 

3 

10,13 

9,55 

9,28 

9,12 

9,01 

8,94 

8,89 

8,85 

8,81 

8,79 

8,76 

8,74 

8,73 

8,71 

8,70 

8,69 

8,66 

8,64 

8,62 

8,59 

8,57 

8,55 

8,53 

4 

7,71 

6,94 

6,59 

6,39 

6,26 

6,16 

6,09 

6,04 

6,00 

5,96 

5,94 

5,91 

5,89 

5,87 

5,86 

5,84 

5,80 

5,77 

5,75 

5,72 

5,69 

5,66 

5,63 

5 

6,61 

5,79 

5,41 

5,19 

5,05 

4,95 

4,88 

4,82 

4,77 

4,74 

4,70 

4,68 

4,66 

4,64 

4,62 

4,60 

4,56 

4,53 

4,50 

4,46 

4,43 

4,40 

4,37 

6 

5,99 

5,14 

4,76 

4,53 

4,39 

4,28 

4,21 

4,15 

4,10 

4,06 

4,03 

4,00 

3,98 

3,96 

3,94 

3,92 

3,87 

3,84 

3,81 

3,77 

3,74 

3,70 

3,67 

7 

5,59 

4,74 

4,35 

4,12 

3,97 

3,87 

3,79 

3,73 

3,68 

3,64 

3,60 

3,57 

3,55 

3,53 

3,51 

3,49 

3,44 

3,41 

3,38 

3,34 

3,30 

3,27 

3,23 

8 

5,32 

4,46 

4,07 

3,84 

3,69 

3,58 

3,50 

3,44 

3,39 

3,35 

3,31 

3,28 

3,26 

3,24 

3,22 

3,20 

3,15 

3,12 

3,08 

3,04 

3,01 

2,97 

2,93 

9 

5,12 

4,26 

3,86 

3,63 

3,48 

3,37 

3,29 

3,23 

3,18 

3,14 

3,10 

3,07 

3,05 

3,03 

3,01 

2,99 

2,94 

2,90 

2,86 

2,83 

2,79 

2,75 

2,71 

10 

4,96 

4,10 

3,71 

3,48 

3,33 

3,22 

3,14 

3,07 

3,02 

2,98 

2,94 

2,91 

2,89 

2,86 

2,85 

2,83 

2,77 

2,74 

2,70 

2,66 

2,62 

2,58 

2,54 

11 

4,84 

3,98 

3,59 

3,36 

3,20 

3,09 

3,01 

2,95 

2,90 

2,85 

2,82 

2,79 

2,76 

2,74 

2,72 

2,70 

2,65 

2,61 

2,57 

2,53 

2,49 

2,45 

2,40 

12 

4,75 

3,89 

3,49 

3,26 

3,11 

3,00 

2,91 

2,85 

2,80 

2,75 

2,72 

2,69 

2,66 

2,64 

2,62 

2,60 

2,54 

2,51 

2,47 

2,43 

2,38 

2,34 

2,30 

13 

4,67 

3,81 

3,41 

3,18 

3,03 

2,92 

2,83 

2,77 

2,71 

2,67 

2,63 

2,60 

2,58 

2,55 

2,53 

2,51 

2,46 

2,42 

2,38 

2,34 

2,30 

2,25 

2,21 

14 

4,60 

3,74 

3,34 

3,11 

2,96 

2,85 

2,76 

2,70 

2,65 

2,60 

2,57 

2,53 

2,51 

2,48 

2,46 

2,44 

2,39 

2,35 

2,31 

2,27 

2,22 

2,18 

2,13 

15 

4,54 

3,68 

3,29 

3,06 

2,90 

2,79 

2,71 

2,64 

2,59 

2,54 

2,51 

2,48 

2,45 

2,42 

2,40 

2,38 

2,33 

2,29 

2,25 

2,20 

2,16 

2,11 

2,07 

16 

4,49 

3,63 

3,24 

3,01 

2,85 

2,74 

2,66 

2,59 

2,54 

2,49 

2,46 

2,42 

2,40 

2,37 

2,35 

2,33 

2,28 

2,24 

2,19 

2,15 

2,11 

2,06 

2,01 

17 

4,45 

3,59 

3,20 

2,96 

2,81 

2,70 

2,61 

2,55 

2,49 

2,45 

2,41 

2,38 

2,35 

2,33 

2,31 

2,29 

2,23 

2,19 

2,15 

2,10 

2,06 

2,01 

1,96 

18 

4,41 

3,55 

3,16 

2,93 

2,77 

2,66 

2,58 

2,51 

2,46 

2,41 

2,37 

2,34 

2,31 

2,29 

2,27 

2,25 

2,19 

2,15 

2,11 

2,06 

2,02 

1,97 

1,92 

19 

4,38 

3,52 

3,13 

2,90 

2,74 

2,63 

2,54 

2,48 

2,42 

2,38 

2,34 

2,31 

2,28 

2,26 

2,23 

2,21 

2,16 

2,11 

2,07 

2,03 

1,98 

1,93 

1,88 

20 

4,35 

3,49 

3,10 

2,87 

2,71 

2,60 

2,51 

2,45 

2,39 

2,35 

2,31 

2,28 

2,25 

2,22 

2,20 

2,18 

2,12 

2,08 

2,04 

1,99 

1,95 

1,90 

1,84 

21 

4,32 

3,47 

3,07 

2,84 

2,68 

2,57 

2,49 

2,42 

2,37 

2,32 

2,28 

2,25 

2,22 

2,20 

2,18 

2,16 

2,10 

2,05 

2,01 

1,96 

1,92 

1,87 

1,81 

22 

4,30 

3,44 

3,05 

2,82 

2,66 

2,55 

2,46 

2,40 

2,34 

2,30 

2,26 

2,23 

2,20 

2,17 

2,15 

2,13 

2,07 

2,03 

1,98 

1,94 

1,89 

1,84 

1,78 

23 

4,28 

3,42 

3,03 

2,80 

2,64 

2,53 

2,44 

2,37 

2,32 

2,27 

2,24 

2,20 

2,18 

2,15 

2,13 

2,11 

2,05 

2,01 

1,96 

1,91 

1,86 

1,81 

1,76 

24 

4,26 

3,40 

3,01 

2,78 

2,62 

2,51 

2,42 

2,36 

2,30 

2,25 

2,22 

2,18 

2,15 

2,13 

2,11 

2,09 

2,03 

1,98 

1,94 

1,89 

1,84 

1,79 

1,73 

25 

4,24 

3,39 

2,99 

2,76 

2,60 

2,49 

2,40 

2,34 

2,28 

2,24 

2,20 

2,16 

2,14 

2,11 

2,09 

2,07 

2,01 

1,96 

1,92 

1,87 

1,82 

1,77 

1,71 

26 

4,23 

3,37 

2,98 

2,74 

2,59 

2,47 

2,39 

2,32 

2,27 

2,22 

2,18 

2,15 

2,12 

2,09 

2,07 

2,05 

1,99 

1,95 

1,90 

1,85 

1,80 

1,75 

1,69 

27 

4,21 

3,35 

2,96 

2,73 

2,57 

2,46 

2,37 

2,31 

2,25 

2,20 

2,17 

2,13 

2,10 

2,08 

2,06 

2,04 

1,97 

1,93 

1,88 

1,84 

1,79 

1,73 

1,67 

28 

4,20 

3,34 

2,95 

2,71 

2,56 

2,45 

2,36 

2,29 

2,24 

2,19 

2,15 

2,12 

2,09 

2,06 

2,04 

2,02 

1,96 

1,91 

1,87 

1,82 

1,77 

1,71 

1,65 

29 

4,18 

3,33 

2,93 

2,70 

2,55 

2,43 

2,35 

2,28 

2,22 

2,18 

2,14 

2,10 

2,08 

2,05 

2,03 

2,01 

1,94 

1,90 

1,85 

1,81 

1,75 

1,70 

1,64 

30 

4,17 

3,32 

2,92 

2,69 

2,53 

2,42 

2,33 

2,27 

2,21 

2,16 

2,13 

2,09 

2,06 

2,04 

2,01 

1,99 

1,93 

1,89 

1,84 

1,79 

1,74 

1,68 

1,62 

40 

4,08 

3,23 

2,84 

2,61 

2,45 

2,34 

2,25 

2,18 

2,12 

2,08 

2,04 

2,00 

1,97 

1,95 

1,92 

1,90 

1,84 

1,79 

1,74 

1,69 

1,64 

1,58 

1,51 

60 

4,00 

3,15 

2,76 

2,53 

2,37 

2,25 

2,17 

2,10 

2,04 

1,99 

1,95 

1,92 

1,89 

1,86 

1,84 

1,82 

1,75 

1,70 

1,65 

1,59 

1,53 

1,47 

1,39 

120 

3,92 

3,07 

2,68 

2,45 

2,29 

2,18 

2,09 

2,02 

1,96 

1,91 

1,87 

1,83 

1,80 

1,78 

1,75 

1,73 

1,66 

1,61 

1,55 

1,50 

1,43 

1,35 

1,25 

OO 

3,84 

3,00 

2,60 

2,37 

2,21 

2,10 

2,01 

1,94 

1,88 

1,83 

1,79 

1,75 

1,72 

1,69 

1,67 

1,64 

1,57 

1,52 

1,46 

1,39 

1,32 

1,22 

1,01 


Tabelas 


Tabela 5: Limites unilaterais de F ao mvel de 1% de probabilidade 

nl=numero de graus de liberdade do numerador, n2= numero de graus de liberdade do denominador 


n 2 \nl 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

20 

24 

30 

40 

60 

120 

OO 

i 

4052,2 4999,3 5403,5 5624,3 5764,0 5859,0 5928,3 5981,0 6022,4 6055,9 6083,4 6106,7 6125,8 6143,0 6157,0 6170,0 6208,7 6234,3 6260,4 6286,4 6313,0 6339,5 

6365,6 

2 

98,50 

99,00 

99,16 

99,25 

99,30 

99,33 

99,36 

99,38 

99,39 

99,40 

99,41 

99,42 

99,42 

99,43 

99,43 

99,44 

99,45 

99,46 

99,47 

99,48 

99,48 

99,49 

99,50 

3 

34,12 

30,82 

29,46 

28,71 

28,24 

27,91 

27,67 

27,49 

27,34 

27,23 

27,13 

27,05 

26,98 

26,92 

26,87 

26,83 

26,69 

26,60 

26,50 

26,41 

26,32 

26,22 

26,13 

4 

21,20 

18,00 

16,69 

15,98 

15,52 

15,21 

14,98 

14,80 

14,66 

14,55 

14,45 

14,37 

14,31 

14,25 

14,20 

14,15 

14,02 

13,93 

13,84 

13,75 

13,65 

13,56 

13,46 

5 

16,26 

13,27 

12,06 

11,39 

10,97 

10,67 

10,46 

10,29 

10,16 

10,05 

9,96 

9,89 

9,82 

9,77 

9,72 

9,68 

9,55 

9,47 

9,38 

9,29 

9,20 

9,11 

9,02 

6 

13,75 

10,92 

9,78 

9,15 

8,75 

8,47 

8,26 

8,10 

7,98 

7,87 

7,79 

7,72 

7,66 

7,60 

7,56 

7,52 

7,40 

7,31 

7,23 

7,14 

7,06 

6,97 

6,88 

7 

12,25 

9,55 

8,45 

7,85 

7,46 

7,19 

6,99 

6,84 

6,72 

6,62 

6,54 

6,47 

6,41 

6,36 

6,31 

6,28 

6,16 

6,07 

5,99 

5,91 

5,82 

5,74 

5,65 

8 

11,26 

8,65 

7,59 

7,01 

6,63 

6,37 

6,18 

6,03 

5,91 

5,81 

5,73 

5,67 

5,61 

5,56 

5,52 

5,48 

5,36 

5,28 

5,20 

5,12 

5,03 

4,95 

4,86 

9 

10,56 

8,02 

6,99 

6,42 

6,06 

5,80 

5,61 

5,47 

5,35 

5,26 

5,18 

5,11 

5,05 

5,01 

4,96 

4,92 

4,81 

4,73 

4,65 

4,57 

4,48 

4,40 

4,31 

10 

10,04 

7,56 

6,55 

5,99 

5,64 

5,39 

5,20 

5,06 

4,94 

4,85 

4,77 

4,71 

4,65 

4,60 

4,56 

4,52 

4,41 

4,33 

4,25 

4,17 

4,08 

4,00 

3,91 

11 

9,65 

7,21 

6,22 

5,67 

5,32 

5,07 

4,89 

4,74 

4,63 

4,54 

4,46 

4,40 

4,34 

4,29 

4,25 

4,21 

4,10 

4,02 

3,94 

3,86 

3,78 

3,69 

3,60 

12 

9,33 

6,93 

5,95 

5,41 

5,06 

4,82 

4,64 

4,50 

4,39 

4,30 

4,22 

4,16 

4,10 

4,05 

4,01 

3,97 

3,86 

3,78 

3,70 

3,62 

3,54 

3,45 

3,36 

13 

9,07 

6,70 

5,74 

5,21 

4,86 

4,62 

4,44 

4,30 

4,19 

4,10 

4,02 

3,96 

3,91 

3,86 

3,82 

3,78 

3,66 

3,59 

3,51 

3,43 

3,34 

3,25 

3,17 

14 

8,86 

6,51 

5,56 

5,04 

4,69 

4,46 

4,28 

4,14 

4,03 

3,94 

3,86 

3,80 

3,75 

3,70 

3,66 

3,62 

3,51 

3,43 

3,35 

3,27 

3,18 

3,09 

3,00 

15 

8,68 

6,36 

5,42 

4,89 

4,56 

4,32 

4,14 

4,00 

3,89 

3,80 

3,73 

3,67 

3,61 

3,56 

3,52 

3,49 

3,37 

3,29 

3,21 

3,13 

3,05 

2,96 

2,87 

16 

8,53 

6,23 

5,29 

4,77 

4,44 

4,20 

4,03 

3,89 

3,78 

3,69 

3,62 

3,55 

3,50 

3,45 

3,41 

3,37 

3,26 

3,18 

3,10 

3,02 

2,93 

2,84 

2,75 

17 

8,40 

6,11 

5,19 

4,67 

4,34 

4,10 

3,93 

3,79 

3,68 

3,59 

3,52 

3,46 

3,40 

3,35 

3,31 

3,27 

3,16 

3,08 

3,00 

2,92 

2,83 

2,75 

2,65 

18 

8,29 

6,01 

5,09 

4,58 

4,25 

4,01 

3,84 

3,71 

3,60 

3,51 

3,43 

3,37 

3,32 

3,27 

3,23 

3,19 

3,08 

3,00 

2,92 

2,84 

2,75 

2,66 

2,57 

19 

8,18 

5,93 

5,01 

4,50 

4,17 

3,94 

3,77 

3,63 

3,52 

3,43 

3,36 

3,30 

3,24 

3,19 

3,15 

3,12 

3,00 

2,92 

2,84 

2,76 

2,67 

2,58 

2,49 

20 

8,10 

5,85 

4,94 

4,43 

4,10 

3,87 

3,70 

3,56 

3,46 

3,37 

3,29 

3,23 

3,18 

3,13 

3,09 

3,05 

2,94 

2,86 

2,78 

2,69 

2,61 

2,52 

2,42 

21 

8,02 

5,78 

4,87 

4,37 

4,04 

3,81 

3,64 

3,51 

3,40 

3,31 

3,24 

3,17 

3,12 

3,07 

3,03 

2,99 

2,88 

2,80 

2,72 

2,64 

2,55 

2,46 

2,36 

22 

7,95 

5,72 

4,82 

4,31 

3,99 

3,76 

3,59 

3,45 

3,35 

3,26 

3,18 

3,12 

3,07 

3,02 

2,98 

2,94 

2,83 

2,75 

2,67 

2,58 

2,50 

2,40 

2,31 

23 

7,88 

5,66 

4,76 

4,26 

3,94 

3,71 

3,54 

3,41 

3,30 

3,21 

3,14 

3,07 

3,02 

2,97 

2,93 

2,89 

2,78 

2,70 

2,62 

2,54 

2,45 

2,35 

2,26 

24 

7,82 

5,61 

4,72 

4,22 

3,90 

3,67 

3,50 

3,36 

3,26 

3,17 

3,09 

3,03 

2,98 

2,93 

2,89 

2,85 

2,74 

2,66 

2,58 

2,49 

2,40 

2,31 

2,21 

25 

7,77 

5,57 

4,68 

4,18 

3,85 

3,63 

3,46 

3,32 

3,22 

3,13 

3,06 

2,99 

2,94 

2,89 

2,85 

2,81 

2,70 

2,62 

2,54 

2,45 

2,36 

2,27 

2,17 

26 

7,72 

5,53 

4,64 

4,14 

3,82 

3,59 

3,42 

3,29 

3,18 

3,09 

3,02 

2,96 

2,90 

2,86 

2,81 

2,78 

2,66 

2,58 

2,50 

2,42 

2,33 

2,23 

2,13 

27 

7,68 

5,49 

4,60 

4,11 

3,78 

3,56 

3,39 

3,26 

3,15 

3,06 

2,99 

2,93 

2,87 

2,82 

2,78 

2,75 

2,63 

2,55 

2,47 

2,38 

2,29 

2,20 

2,10 

28 

7,64 

5,45 

4,57 

4,07 

3,75 

3,53 

3,36 

3,23 

3,12 

3,03 

2,96 

2,90 

2,84 

2,79 

2,75 

2,72 

2,60 

2,52 

2,44 

2,35 

2,26 

2,17 

2,06 

29 

7,60 

5,42 

4,54 

4,04 

3,73 

3,50 

3,33 

3,20 

3,09 

3,00 

2,93 

2,87 

2,81 

2,77 

2,73 

2,69 

2,57 

2,49 

2,41 

2,33 

2,23 

2,14 

2,03 

30 

7,56 

5,39 

4,51 

4,02 

3,70 

3,47 

3,30 

3,17 

3,07 

2,98 

2,91 

2,84 

2,79 

2,74 

2,70 

2,66 

2,55 

2,47 

2,39 

2,30 

2,21 

2,11 

2,01 

40 

7,31 

5,18 

4,31 

3,83 

3,51 

3,29 

3,12 

2,99 

2,89 

2,80 

2,73 

2,66 

2,61 

2,56 

2,52 

2,48 

2,37 

2,29 

2,20 

2,11 

2,02 

1,92 

1,80 

60 

7,08 

4,98 

4,13 

3,65 

3,34 

3,12 

2,95 

2,82 

2,72 

2,63 

2,56 

2,50 

2,44 

2,39 

2,35 

2,31 

2,20 

2,12 

2,03 

1,94 

1,84 

1,73 

1,60 

120 

6,85 

4,79 

3,95 

3,48 

3,17 

2,96 

2,79 

2,66 

2,56 

2,47 

2,40 

2,34 

2,28 

2,23 

2,19 

2,15 

2,03 

1,95 

1,86 

1,76 

1,66 

1,53 

1,38 

OO 

6,64 

4,61 

3,78 

3,32 

3,02 

2,80 

2,64 

2,51 

2,41 

2,32 

2,25 

2,18 

2,13 

2,08 

2,04 

2,00 

1,88 

1,79 

1,70 

1,59 

1,47 

1,32 

1,01 
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Tabela 6: Valores de t em nfveis de 10% a 0,1% de probabilidade. 


GL 

0,1 

0,05 

0,02 

0,01 

0,001 

1 

6,31 

12,71 

31,82 

63,66 

636,58 

2 

2,92 

4,30 

6,96 

9,92 

31,60 

3 

2,35 

3,18 

4,54 

5,84 

12,92 

4 

2,13 

2,78 

3,75 

4,60 

8,61 

5 

2,02 

2,57 

3,36 

4,03 

6,87 

6 

1,94 

2,45 

3,14 

3,71 

5,96 

7 

1,89 

2,36 

3,00 

3,50 

5,41 

8 

1,86 

2,31 

2,90 

3,36 

5,04 

9 

1,83 

2,26 

2,82 

3,25 

4,78 

10 

1,81 

2,23 

2,76 

3,17 

4,59 

11 

1,80 

2,20 

2,72 

3,11 

4,44 

12 

1,78 

2,18 

2,68 

3,05 

4,32 

13 

1,77 

2,16 

2,65 

3,01 

4,22 

14 

1,76 

2,14 

2,62 

2,98 

4,14 

15 

1,75 

2,13 

2,60 

2,95 

4,07 

16 

1,75 

2,12 

2,58 

2,92 

4,01 

17 

1,74 

2,11 

2,57 

2,90 

3,97 

18 

1,73 

2,10 

2,55 

2,88 

3,92 

19 

1,73 

2,09 

2,54 

2,86 

3,88 

20 

1,72 

2,09 

2,53 

2,85 

3,85 

21 

1,72 

2,08 

2,52 

2,83 

3,82 

22 

1,72 

2,07 

2,51 

2,82 

3,79 

23 

1,71 

2,07 

2,50 

2,81 

3,77 

24 

1,71 

2,06 

2,49 

2,80 

3,75 

25 

1,71 

2,06 

2,49 

2,79 

3,73 

26 

1,71 

2,06 

2,48 

2,78 

3,71 

27 

1,70 

2,05 

2,47 

2,77 

3,69 

28 

1,70 

2,05 

2,47 

2,76 

3,67 

29 

1,70 

2,05 

2,46 

2,76 

3,66 

30 

1,70 

2,04 

2,46 

2,75 

3,65 

40 

1,68 

2,02 

2,42 

2,70 

3,55 

60 

1,67 

2,00 

2,39 

2,66 

3,46 

120 

1,66 

1,98 

2,36 

2,62 

3,37 

oo 

1,65 

1,96 

2,33 

2,58 

3,30 


Tabela 7: Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao m'vel de 5% de probabilidade. 
I=numero de tratamentos, GLRES= numero de graus de liberdade do reslduo. 


GLRES\I 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

1 

17,97 

26,98 

32,82 

37,08 

40,41 

43,40 

45,40 

47,36 

49,07 

50,59 

51,96 

53,20 

54,33 

55,36 

56,32 

57,22 

58,04 

58,83 

59,56 

2 

6,09 

8,33 

9,80 

10,88 

11,74 

12,44 

13,03 

13,54 

13,99 

14,39 

14,75 

15,08 

15,33 

15,65 

15,91 

16,14 

16,37 

16,57 

16,77 

3 

4,50 

5,91 

6,83 

7,50 

8,04 

8,48 

8,85 

9,18 

9,46 

9,72 

9,95 

10,15 

10,35 

10,53 

10,69 

10,84 

10,98 

11,11 

11,24 

4 

3,93 

5,04 

5,76 

6,29 

6,71 

7,05 

7,35 

7,60 

7,83 

8,03 

8,21 

8,37 

8,53 

8,66 

8,79 

8,91 

9,03 

9,13 

9,23 

5 

3,64 

4,60 

5,22 

5,67 

6,03 

6,33 

6,58 

6,80 

7,00 

7,17 

7,32 

7,47 

7,60 

7,72 

7,83 

7,93 

8,03 

8,12 

8,21 

6 

3,46 

4,34 

4,90 

5,31 

5,63 

5,90 

6,12 

6,32 

6,49 

6,65 

6,79 

6,92 

7,03 

7,14 

7,24 

7,34 

7,43 

7,51 

7,59 

7 

3,34 

4,17 

4,68 

5,06 

5,36 

5,61 

5,82 

6,00 

6,16 

6,30 

6,43 

6,55 

6,66 

6,76 

6,85 

6,94 

7,02 

7,10 

7,17 

8 

3,26 

4,04 

4,53 

4,89 

5,17 

5,40 

5,60 

5,77 

5,92 

6,05 

6,18 

6,29 

6,39 

6,48 

6,57 

6,65 

6,73 

6,80 

6,87 

9 

3,20 

3,95 

4,42 

4,76 

5,02 

5,24 

5,43 

5,60 

5,74 

5,87 

5,98 

6,09 

6,19 

6,28 

6,36 

6,44 

6,51 

6,58 

6,64 

10 

3,15 

3,88 

4,33 

4,65 

4,91 

5,12 

5,31 

5,46 

5,60 

5,72 

5,83 

5,94 

6,03 

6,11 

6,19 

6,27 

6,34 

6,41 

6,47 

11 

3,11 

3,82 

4,26 

4,57 

4,82 

5,03 

5,20 

5,35 

5,49 

5,61 

5,71 

5,81 

5,90 

5,98 

6,06 

6,13 

6,20 

6,27 

6,33 

12 

3,08 

3,77 

4,20 

4,51 

4,75 

4,95 

5,12 

5,27 

5,40 

5,51 

5,62 

5,71 

5,80 

5,88 

5,95 

6,02 

6,09 

6,15 

6,21 

13 

3,06 

3,74 

4,15 

4,45 

4,69 

4,89 

5,05 

5,19 

5,32 

5,43 

5,53 

5,63 

5,71 

5,79 

5,86 

5,93 

6,00 

6,06 

6,11 

14 

3,03 

3,70 

4,11 

4,41 

4,64 

4,83 

4,99 

5,13 

5,25 

5,36 

5,46 

5,55 

5,64 

5,71 

5,79 

5,85 

5,92 

5,97 

6,03 

15 

3,01 

3,67 

4,08 

4,37 

4,60 

4,78 

4,94 

5,08 

5,20 

5,31 

5,40 

5,49 

5,57 

5,65 

5,72 

5,79 

5,85 

5,90 

5,96 

16 

3,00 

3,65 

4,05 

4,33 

4,56 

4,74 

4,90 

5,03 

5,15 

5,26 

5,35 

5,44 

5,52 

5,59 

5,66 

5,73 

5,79 

5,84 

5,90 

17 

2,98 

3,63 

4,02 

4,30 

4,52 

4,71 

4,86 

4,99 

5,11 

5,21 

5,31 

5,39 

5,47 

5,54 

5,61 

5,68 

5,73 

5,79 

5,84 

18 

2,97 

3,61 

4,00 

4,28 

4,50 

4,67 

4,82 

4,96 

5,07 

5,17 

5,27 

5,35 

5,43 

5,50 

5,57 

5,63 

5,69 

5,74 

5,79 

19 

2,96 

3,59 

3,98 

4,25 

4,47 

4,65 

4,79 

4,92 

5,04 

5,14 

5,23 

5,32 

5,39 

5,46 

5,53 

5,59 

5,65 

5,70 

5,75 

20 

2,95 

3,58 

3,96 

4,23 

4,45 

4,62 

4,77 

4,90 

5,01 

5,11 

5,20 

5,28 

5,36 

5,43 

5,49 

5,55 

5,61 

5,66 

5,71 

24 

2,92 

3,53 

3,90 

4,17 

4,37 

4,54 

4,68 

4,81 

4,92 

5,01 

5,10 

5,18 

5,25 

5,32 

5,38 

5,44 

5,49 

5,55 

5,59 

30 

2,89 

3,49 

3,85 

4,10 

4,30 

4,46 

4,60 

4,72 

4,82 

4,92 

5,00 

5,08 

5,15 

5,21 

5,27 

5,33 

5,38 

5,43 

5,48 

40 

2,86 

3,44 

3,79 

4,04 

4,23 

4,39 

4,52 

4,64 

4,74 

4,82 

4,90 

4,98 

5,04 

5,11 

5,16 

5,22 

5,27 

5,31 

5,36 

60 

2,83 

3,40 

3,74 

3,98 

4,16 

4,31 

4,44 

4,55 

4,65 

4,73 

4,81 

4,88 

4,94 

5,00 

5,06 

5,11 

5,15 

5,20 

5,24 

120 

2,80 

3,36 

3,69 

3,92 

4,10 

4,24 

4,36 

4,47 

4,56 

4,64 

4,71 

4,78 

4,84 

4,90 

4,95 

5,00 

5,04 

5,09 

5,13 

oo 

2,77 

3,31 

3,63 

3,86 

4,03 

4,17 

4,29 

4,39 

4,47 

4,55 

4,62 

4,69 

4,74 

4,80 

4,85 

4,89 

4,93 

4,97 

5,01 


4 ^ 

CO 
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Tabela 8: Distribuigao de Qui-quadrado. Valor crftico de x 2 tal que P(Xk > Xo) = a ■ 


GL 

0,995 

0,975 

0,05 

0,025 

0,01 

0,005 

1 

0,00 

0,00 

3,84 

5,02 

6,63 

7,88 

2 

0,01 

0,05 

5,99 

7,38 

9,21 

10,60 

3 

0,07 

0,22 

7,81 

9,35 

11,34 

12,84 

4 

0,21 

0,48 

9,49 

11,14 

13,28 

14,86 

5 

0,41 

0,83 

11,07 

12,83 

15,09 

16,75 

6 

0,68 

1,24 

12,59 

14,45 

16,81 

18,55 

7 

0,99 

1,69 

14,07 

16,01 

18,48 

20,28 

8 

1,34 

2,18 

15,51 

17,53 

20,09 

21,95 

9 

1,73 

2,70 

16,92 

19,02 

21,67 

23,59 

10 

2,16 

3,25 

18,31 

20,48 

23,21 

25,19 

11 

2,60 

3,82 

19,68 

21,92 

24,73 

26,76 

12 

3,07 

4,40 

21,03 

23,34 

26,22 

28,30 

13 

3,57 

5,01 

22,36 

24,74 

27,69 

29,82 

14 

4,07 

5,63 

23,68 

26,12 

29,14 

31,32 

15 

4,60 

6,26 

25,00 

27,49 

30,58 

32,80 

16 

5,14 

6,91 

26,30 

28,85 

32,00 

34,27 

17 

5,70 

7,56 

27,59 

30,19 

33,41 

35,72 

18 

6,26 

8,23 

28,87 

31,53 

34,81 

37,16 

19 

6,84 

8,91 

30,14 

32,85 

36,19 

38,58 

20 

7,43 

9,59 

31,41 

34,17 

37,57 

40,00 

21 

8,03 

10,28 

32,67 

35,48 

38,93 

41,40 

22 

8,64 

10,98 

33,92 

36,78 

40,29 

42,80 

23 

9,26 

11,69 

35,17 

38,08 

41,64 

44,18 

24 

9,89 

12,40 

36,42 

39,36 

42,98 

45,56 

25 

10,52 

13,12 

37,65 

40,65 

44,31 

46,93 

26 

11,16 

13,84 

38,89 

41,92 

45,64 

48,29 

27 

11,81 

14,57 

40,11 

43,19 

46,96 

49,65 

28 

12,46 

15,31 

41,34 

44,46 

48,28 

50,99 

29 

13,12 

16,05 

42,56 

45,72 

49,59 

52,34 

30 

13,79 

16,79 

43,77 

46,98 

50,89 

53,67 

40 

20,71 

24,43 

55,76 

59,34 

63,69 

66,77 

50 

27,99 

32,36 

67,50 

71,42 

76,15 

79,49 

60 

35,53 

40,48 

79,08 

83,30 

88,38 

91,95 

70 

43,28 

48,76 

90,53 

95,02 

100,43 

104,21 

80 

51,17 

57,15 

101,88 

106,63 

112,33 

116,32 

90 

59,20 

65,65 

113,15 

118,14 

124,12 

128,30 

100 

67,33 

74,22 

124,34 

129,56 

135,81 

140,17 
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Tabela 9: Constantes utilizadas em graficos de controle. 


n 

2 

3 

4 

5 

6 

7 

8 

9 

10 

d 2 

1,128 

1,693 

2,059 

2,326 

2,534 

2,704 

2,847 

2,970 

3,078 

a 2 

1,880 

1,023 

0,729 

0,577 

0,483 

0,419 

0,373 

0,337 

0,308 

d 3 

0 

0 

0 

0 

0 

0,076 

0,136 

0,184 

0,223 

d a 

3,267 

2,574 

2,282 

2,115 

2,004 

1,924 

1,864 

1,816 

1,777 
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Tabela 10: Tabela de numeros aleatorios. 


5831 

3593 

7697 

2402 

7192 

9763 

2608 

7666 

4805 

8983 

0329 

4626 

1431 

2626 

2218 

6421 

4003 

0693 

4081 

9964 

0887 

4587 

2648 

2129 

0498 

9704 

4756 

0118 

1180 

1277 

1498 

1963 

4045 

1073 

6264 

5038 

4925 

2853 

1290 

0099 

9595 

6956 

2372 

0274 

2471 

3788 

9312 

4956 

7262 

4057 

4845 

8640 

0425 

4696 

4774 

4046 

0852 

5475 

7236 

4777 

5170 

0203 

4461 

4874 

1298 

2457 

2775 

3462 

6009 

5119 

7337 

1302 

4168 

7779 

4144 

1390 

9695 

6552 

9329 

2647 

2746 

6260 

3101 

4268 

6591 

1320 

8902 

3486 

9066 

5121 

9471 

8821 

4898 

6327 

2711 

2013 

0792 

5373 

4664 

9335 

6172 

3755 

5232 

6237 

9471 

1128 

2456 

8640 

3924 

1947 

1923 

5535 

1086 

6247 

5881 

1976 

5393 

9006 

9362 

7370 

1070 

7911 

0222 

2388 

2552 

4188 

4593 

8292 

3719 

1226 

9038 

4724 

1221 

6165 

0037 

4000 

5508 

9928 

8988 

1470 

5709 

0600 

3585 

1096 

4035 

5872 

3871 

7458 

6621 

7333 

2129 

7857 

7369 

4400 

8369 

6732 

8793 

8982 

8134 

2611 

4941 

6740 

8781 

2886 

2012 

4945 

0264 

3763 

1762 

7386 

6202 

4037 

9508 

5436 

8916 

0458 

7179 

6309 

4185 

4682 

6866 

9907 

9743 

1329 

4079 

3955 

9463 

9986 

5227 

1770 

2769 

5101 

5428 

7775 

7116 

0745 

7552 

1681 

5522 

1667 

4898 

6958 

5210 

4028 

8048 

9149 

3589 

0240 

3546 

4945 

4353 

9374 

7637 

3488 

0494 

8868 

6563 

6774 

9651 

1073 

5409 

8034 

3418 

9449 

5214 

6998 

4539 

7871 

5044 

3203 

4891 

7862 

8298 

9234 

7204 

7190 

6566 

1856 

2168 

9239 

0360 

7198 

2739 

3830 

3786 

8491 

9299 

3728 

7012 

1126 

3983 

9363 

1160 

3338 

6426 

0725 

6483 

3444 

1453 

2868 

4664 

2212 

1538 

2411 

7811 

8247 

8095 

2753 

6160 

7533 

6438 

4394 

3756 

8422 

4025 

1408 

1366 

7558 

9937 

6569 

7616 

2278 

7790 

3027 

0741 

8139 

5109 

3346 

1354 

4499 

9764 

7151 

7209 

9928 

4897 

4321 

7532 

6877 

3750 

3949 

1637 

6059 

6343 

0849 

8914 

3694 

3972 

0833 

8150 

2178 

2447 

5433 

3293 

8925 

7496 

6506 

4186 

9895 

0069 

0818 

3768 

8880 

3248 

8456 

8902 

5854 

4263 

6916 

4360 

7137 

4826 

9219 

1854 

4410 

0628 

7700 


